日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

谷歌新架構突破Transformer超長上下文瓶頸!Hinton靈魂拷問:后悔Open嗎?

   時間:2025-12-06 01:12:30 來源:量子位編輯:快訊 IP:北京 發表評論無障礙通道
 

Transformer的提出者谷歌,剛剛上來給了Transformer梆梆就兩拳(doge)。

兩項關于大模型新架構的研究一口氣在NeurIPS 2025上發布,通過“測試時訓練”機制,能在推理階段將上下文窗口擴展至200萬token。

兩項新成果分別是:

Titans:兼具RNN速度和Transformer性能的全新架構;MIRAS:Titans背后的核心理論框架。

核心要解決的,就是Transformer架構在處理超長上下文時的根本局限:計算成本會隨著序列長度的增加而猛增。

不得不說,從Nano Banana到Gemini 3 Pro,再到基礎研究方面的進展,谷歌最近一段時間就是一個窮追猛打的架勢。

也難怪奧特曼要給OpenAI拉“紅色警報”了。

突破Transformer超長上下文瓶頸

現在AI領域已經達成共識的是,Transformer雖好,但自注意力機制的效率問題正在日益凸顯:每個token都要“關注”其他所有token,導致計算量和內存消耗與序列長度的平方成正比(O(N2))。

學界已經探索了多種解決方案,比如線性循環網絡(RNNs)和狀態空間模型(SSMs)等。

這類模型通過將上下文壓縮到固定大小來實現快速線性擴展。問題是,這種方法仍然無法充分捕捉超長序列中的豐富信息。

Titans + MIRAS,是谷歌提出的新架構和理論藍圖,目的是將RNN的速度和Transformer的性能結合到一起。

其中Titans可以理解為具體的工具,而MIRAS則是理論框架。兩者共同推進了測試時記憶的概念:

即模型在運行過程中,無需專門的離線重新訓練,就能通過整合更多信息來維持長期記憶。

本質上,可以說這個新架構的重點,是重新定義Transformer的“記憶模式”,將其進化為一種更強大的混合架構。

Titans:在線將上下文擴展至200萬

具體來說,Titans引入了一種新的神經長期記憶模塊。

與傳統RNN中固定大小的向量或矩陣記憶不同,該模塊本質上是一個在測試時動態更新權重的多層感知機(MLP)。

其獨特之處就在于,通常模型訓練完后,權重就固定了,但在Titans中,這個記憶模塊在推理階段依然在更新。

MAC(Memory as Context)是Titans架構的一種主要變體,設計思路是,將長期記憶作為一種額外的上下文信息,直接“喂”給注意力機制。

△MAC架構

研究人員發現,這個新的記憶模塊能顯著提升模型的表達能力,使其在不丟失重要上下文的情況下概括并理解大量信息。

更為重要的是,Titans并非被動地存儲數據,而是能在輸入數據中,主動學習如何識別并保留連接各個token的重要關系和概念。其中的關竅是“意外”。

在人類心理學中,我們很容易忘記一些常規的、預期之內的事情,但往往對“意外事件”印象深刻。

對于Titans也存在類似的情況。研究人員將其定義為“驚喜指標”(surprise metric):指模型檢測到當前記憶的內容和新輸入內容之間存在較大差異。

低意外度:比如新詞是“貓”,而模型的記憶狀態已經預測到會有一個動物詞,那么梯度(意外度)就很低。這時模型僅將這個詞作為短期記憶來處理即可。高意外度:如果模型的記憶狀態是正在總結一份嚴肅的財務報告,而新的輸入是香蕉皮的圖片(意外事件),則意外度將非常高。這表明新的輸入很重要或異常,需要優先將其存儲到長期記憶模塊中。

這樣對“意外”的判斷使得Titans架構能夠有選擇地更新長期記憶,從而保持快速和高效。

實驗表明,Titans的MAC變體能夠有效將上下文窗口擴展到200萬,并在“大海撈針”任務中保持高準確率。

MIRAS:序列建模的統一框架

如果說Titans是跑車,那么MIRAS就是背后的核心引擎。

MIRAS核心目標是讓模型在推理階段也能進行學習。其獨特之處在于,它不把不同的架構視為不同問題的解決方法,而是將其視為解決同一問題的不同途徑:

高效地將新信息與舊信息相結合,同時又不遺漏關鍵概念。

MIRAS將任意序列模型結構為4個關鍵設計選擇:

內存架構:存儲信息的結構(如向量、矩陣,或Titans中的MLP)。注意力偏差:模型優化的內部學習目標,決定模型優先考慮的內容。保留門控(Retention Gate):即“遺忘機制”,用于平衡“學習新知識”與“保留舊記憶”。記憶算法:用于更新記憶狀態的優化算法。

現有的序列模型大多依賴均方誤差(MSE)或點積相似度來更新記憶。

MIRAS的另一個創新,是引入非歐幾里得目標函數,允許使用更復雜的數學懲罰機制。

谷歌的研究人員基于MIRAS,創建了三個特定的無注意力模型:

YAAD:使用更溫和Huber Loss來處理錯誤,對異常值(如文檔中的拼寫錯誤)不敏感,魯棒性更強。MONETA:使用Generalized Norms(廣義范數),通過更嚴格的規則來管理注意力和遺忘,提升記憶穩定性。MEMORA:強制記憶像概率圖一樣運作,確保信息整合過程的受控和平衡。

實驗結果顯示,基于Titans和MIRAS的模型性能優于最先進的線性循環模型(如Mamba 2),以及規模相近的Transformer基線模型。

更顯著的優勢在于,新架構能夠處理極長上下文,在參數規模小得多的情況下,性能優于GPT-4等大規模模型。

One More Thing

超越Transformer的探索還在繼續,但不可否認的是,Transformer依然是大模型時代的理論基石。

那么,曾經一度在競爭中落后的谷歌,是否會后悔公開了Transformer的研究呢?

同樣是在NeurIPS 2025上,Jeff Dean回答了諾獎得主、圖靈獎得主Hinton提出的這個問題:

不,它對世界產生了巨大的積極影響。

這格局,谷谷人人又希希了。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
韩国av一区二区三区四区 | 91国在线观看| 欧美精品99久久久**| 国产人成一区二区三区影院| 亚洲国产日韩a在线播放性色| 风间由美一区二区av101| 欧美麻豆精品久久久久久| 国产精品久久久久久久第一福利| 免费成人在线观看视频| 在线免费不卡视频| 中文字幕一区二区在线观看| 精品一区二区三区免费| 欧美日韩久久一区二区| 亚洲欧美一区二区久久 | 亚洲一区二区av在线| 高清成人在线观看| 欧美成人一区二区三区在线观看| 亚洲成人第一页| 91色.com| 国产精品久久久久久久久久久免费看| 激情久久五月天| 欧美一区二区国产| 午夜婷婷国产麻豆精品| 色悠悠亚洲一区二区| 日本一区二区三区四区| 激情综合色播激情啊| 日韩一区二区中文字幕| 亚洲成人手机在线| 日本黄色一区二区| 亚洲精品国产无天堂网2021| 成人免费视频一区二区| 国产亚洲精品精华液| 国产在线播放一区| 精品国产伦一区二区三区免费| 日韩国产成人精品| 欧美精选在线播放| 午夜精品成人在线视频| 欧美性生活久久| 樱花影视一区二区| 欧美自拍偷拍一区| 亚洲国产wwwccc36天堂| 欧美性xxxxx极品少妇| 一区二区三区在线免费观看 | 天天综合网天天综合色| 欧美婷婷六月丁香综合色| 夜夜嗨av一区二区三区网页| 日本国产一区二区| 一区二区三区精品久久久| 99riav一区二区三区| 亚洲欧美激情一区二区| 一本色道a无线码一区v| 亚洲一区二区三区在线播放| 欧美日韩视频第一区| 日韩二区三区在线观看| 日韩欧美一级精品久久| 激情五月激情综合网| 国产丝袜美腿一区二区三区| 成人一区二区三区中文字幕| 国产精品成人免费| 色一情一乱一乱一91av| 亚洲国产中文字幕在线视频综合| 欧美视频在线一区| 免费在线观看日韩欧美| 精品盗摄一区二区三区| 国产成+人+日韩+欧美+亚洲| 国产精品成人一区二区艾草 | 国产精品一区免费视频| 国产精品伦理一区二区| 色婷婷激情久久| 婷婷开心激情综合| 精品国产一区二区三区av性色| 国产成人自拍高清视频在线免费播放| 国产精品久久久一本精品| 色网综合在线观看| 日韩av一级电影| 国产偷国产偷精品高清尤物| 91免费看`日韩一区二区| 亚洲va欧美va天堂v国产综合| 日韩精品一区二区三区在线观看| 高清不卡在线观看| 一区二区三区四区高清精品免费观看| 欧美美女视频在线观看| 国产精品一区二区免费不卡 | 日韩视频一区二区三区| 懂色一区二区三区免费观看| 一区二区久久久| 精品国内二区三区| 91麻豆精品在线观看| 免费人成精品欧美精品 | 91精品国产一区二区三区| 国产精品69毛片高清亚洲| 亚洲免费观看视频| 日韩女优电影在线观看| 99视频精品免费视频| 日本aⅴ亚洲精品中文乱码| 欧美激情综合在线| 欧美精品自拍偷拍| 成人福利视频网站| 奇米精品一区二区三区在线观看 | 欧美一区二区三区四区视频| 国产成人aaaa| 日韩高清欧美激情| 国产精品天美传媒| 欧美一级理论性理论a| 92精品国产成人观看免费| 日本不卡123| 亚洲欧美日韩国产中文在线| 精品国一区二区三区| 欧美在线一区二区| 国产91富婆露脸刺激对白| 奇米四色…亚洲| 亚洲精品国产a| 国产女人水真多18毛片18精品视频| 欧美日韩一区二区三区四区五区| 国产成人三级在线观看| 丝袜美腿成人在线| 亚洲男女毛片无遮挡| 欧美精品一区二区久久婷婷| 欧美日韩激情一区| 99视频一区二区三区| 国产综合久久久久久鬼色 | 1区2区3区国产精品| 久久夜色精品国产欧美乱极品| 欧美综合色免费| av在线一区二区三区| 国产一区在线视频| 日本美女一区二区三区| 一区二区不卡在线播放| 亚洲国产精品传媒在线观看| 日韩一二三区视频| 欧美精品成人一区二区三区四区| 91色视频在线| 成人av电影免费观看| 国产成人精品免费一区二区| 美腿丝袜亚洲综合| 午夜精品久久久久久久| 一区免费观看视频| 日本一区二区久久| www激情久久| 日韩欧美一二三四区| 91精品婷婷国产综合久久性色 | 色综合久久久久久久久久久| 国产成人午夜电影网| 国产主播一区二区| 久久精品噜噜噜成人av农村| 日韩精品国产精品| 天天综合天天做天天综合| 亚洲综合久久久| 亚洲蜜桃精久久久久久久| 亚洲视频小说图片| 亚洲图片激情小说| 日韩一区日韩二区| 中文字幕日韩精品一区| 国产精品美日韩| 国产精品美女久久久久久久久 | 国产日韩v精品一区二区| 久久噜噜亚洲综合| 久久一区二区三区四区| 久久这里只有精品视频网| 26uuu精品一区二区| 久久免费电影网| 国产蜜臀av在线一区二区三区| 国产日韩精品一区二区三区| 国产日韩精品视频一区| 日本一区二区成人在线| 国产精品国产三级国产普通话蜜臀| 国产三级欧美三级| 中文字幕视频一区| 亚洲黄一区二区三区| 亚洲一区二区三区四区的 | 国产亚洲午夜高清国产拍精品 | 在线观看视频一区| 欧美日韩一卡二卡三卡 | 成人免费黄色大片| 99久久99久久精品国产片果冻 | 久久99精品久久久久久国产越南 | 99re66热这里只有精品3直播 | 91美女在线观看| 欧美日韩你懂的| 日韩免费电影网站| 久久精品水蜜桃av综合天堂| 国产欧美一区视频| 亚洲狼人国产精品| 视频一区中文字幕国产| 久久精品国产一区二区三区免费看 | 日韩精品一区二区三区视频播放| 久久综合九色综合97婷婷女人 | 精品国产精品一区二区夜夜嗨| 久久精品人人爽人人爽| 亚洲欧美中日韩| 亚洲高清一区二区三区| 九九在线精品视频| 成人免费观看男女羞羞视频| 在线日韩一区二区| 欧美一区二区三区四区视频| 久久久一区二区三区捆绑**| 国产精品久久久久久久久免费樱桃 | 亚洲欧美日韩一区二区 | 亚洲精品水蜜桃| 另类成人小视频在线|