在全球科技巨頭紛紛加碼大語言模型(LLM)的浪潮中,圖靈獎(jiǎng)得主、meta首席AI科學(xué)家Yann LeCun卻選擇了一條截然不同的道路。這位被譽(yù)為“AI教父”的學(xué)者宣布,將于年底結(jié)束在meta長達(dá)12年的任職,轉(zhuǎn)而投身創(chuàng)業(yè),致力于開發(fā)能夠理解物理世界的機(jī)器智能系統(tǒng)。
LeCun的離職并非突然之舉。早在數(shù)月前,他便多次公開質(zhì)疑LLM的技術(shù)路線,認(rèn)為這類基于文本生成的模型雖在語言處理領(lǐng)域表現(xiàn)卓越,卻缺乏對(duì)真實(shí)世界的認(rèn)知能力。他指出,當(dāng)前AI系統(tǒng)在記憶存儲(chǔ)、多步推理等方面存在明顯短板,僅靠擴(kuò)大模型規(guī)模無法實(shí)現(xiàn)真正的通用人工智能(AGI)。
在巴黎舉辦的AI-Pulse活動(dòng)上,LeCun進(jìn)一步闡述了他的技術(shù)愿景。他強(qiáng)調(diào),自主機(jī)器智能需要建立在“世界模型”基礎(chǔ)之上——這種模型通過視覺等感官信息訓(xùn)練,能夠預(yù)測(cè)物理世界的演變規(guī)律。與之形成對(duì)比的是,LLM更像是“文本生成器”,屬于快速反應(yīng)的System 1系統(tǒng),而非具備深度推理能力的System 2系統(tǒng)。
這位學(xué)者對(duì)技術(shù)路線的堅(jiān)持,與meta的戰(zhàn)略方向產(chǎn)生了顯著分歧。盡管公司CEO馬克·扎克伯格曾公開表示支持,但實(shí)際行動(dòng)卻頗為謹(jǐn)慎。LeCun透露,meta并未參與其新創(chuàng)業(yè)項(xiàng)目的投資,雙方在技術(shù)路徑上的分歧已難以調(diào)和。這種矛盾在meta近期重金招募LLM專家的舉措中體現(xiàn)得尤為明顯——公司不惜代價(jià)從競(jìng)爭(zhēng)對(duì)手處挖角,甚至由扎克伯格親自出面挽留人才。
LeCun的技術(shù)理念可追溯至十年前。他長期主張,真正的機(jī)器智能應(yīng)當(dāng)模仿人類嬰兒的學(xué)習(xí)方式:通過觀察和互動(dòng)構(gòu)建對(duì)世界的認(rèn)知模型。為此,他帶領(lǐng)團(tuán)隊(duì)開發(fā)了非生成式的聯(lián)合嵌入預(yù)測(cè)架構(gòu)(JEPA),這種系統(tǒng)能夠?qū)W習(xí)現(xiàn)實(shí)世界的結(jié)構(gòu)特征,并預(yù)測(cè)不同行動(dòng)可能產(chǎn)生的結(jié)果。相較于依賴自回歸機(jī)制的LLM,JEPA架構(gòu)更接近人類認(rèn)知世界的模式。
在具體實(shí)踐層面,LeCun的團(tuán)隊(duì)不僅使用視頻數(shù)據(jù),還引入電子游戲等交互式場(chǎng)景進(jìn)行模型訓(xùn)練。他解釋稱,單純依賴視頻數(shù)據(jù)存在局限性——就像觀看夢(mèng)境般缺乏參與感,而真正的智能需要具備預(yù)測(cè)不同行動(dòng)后果的能力。這種思路與當(dāng)前主流的“視頻模型”形成鮮明對(duì)比,體現(xiàn)了其對(duì)交互式學(xué)習(xí)的高度重視。
這位學(xué)者的技術(shù)主張引發(fā)了行業(yè)廣泛討論。支持者認(rèn)為,他指出了當(dāng)前AI發(fā)展的瓶頸;反對(duì)者則質(zhì)疑,放棄已被驗(yàn)證的LLM路線是否明智。市場(chǎng)對(duì)此反應(yīng)敏感:在LeCun離職消息傳出后,meta股價(jià)短暫下跌2%,反映出投資者對(duì)公司技術(shù)方向調(diào)整的擔(dān)憂。










