近日,AI領域掀起一場關于技術路線的激烈討論,焦點人物正是被譽為“AI教父”的圖靈獎得主楊立昆。這位meta首席AI科學家被曝正在籌備離職創業,其目標直指當前硅谷主流的大語言模型(LLM),轉而推動一種全新的“世界模型”架構。這一舉動被業界視為對現有AI發展路徑的重大挑戰,甚至可能引發行業格局的深刻變革。
楊立昆長期主張的“世界模型”與傳統LLM形成鮮明對比。他指出,當前主流的LLM如同“文字專家”,通過海量文本數據訓練,擅長語言生成與模式識別,卻缺乏對物理世界的真實理解。例如,當被要求想象一個立方體旋轉90度后的形態時,LLM因缺乏空間推理能力而無法完成。相比之下,楊立昆設想的“世界模型”將通過圖像、視頻和空間數據感知環境,不僅能夠實時估計世界狀態,還能預測動作后的因果結果,從而賦予AI真正的規劃與推理能力。
“我家那只貓的智能都遠超現有LLM。”楊立昆曾用這句尖銳的比喻,直指當前技術路線在常識與因果理解上的短板。他強調,動物通過觀察與行動迅速構建因果模型,而LLM僅依賴統計關聯,無法形成對世界的深層認知。在他看來,無限擴展算力與數據只會讓LLM成為“記憶力超群的復讀機”,而非通往通用人工智能(AGI)的橋梁。
這場理念之爭的背后,是楊立昆與meta戰略方向的深刻分歧。隨著公司全面轉向LLM開發,這位65歲的科學家逐漸被邊緣化。2018年,他卸任管理職務,轉任“個體貢獻者”,不再參與核心項目如開源大模型Llama的研發。今年夏天,年僅28歲的Scale AI創始人汪滔被任命為meta首席AI官,直接成為楊立昆的上級,而另一位年輕科學家趙晟佳的加入,進一步加劇了權力結構的變動。AI部門裁員與資源縮減的消息,也加速了楊立昆的離場決心。
楊立昆的職業生涯始終充滿“叛逆”色彩。早在機器學習尚屬冷門領域時,他便將其作為博士研究方向;在貝爾實驗室期間,他參與開發了銀行廣泛使用的手寫識別技術;2013年,受扎克伯格邀請,他領導meta基礎AI研究實驗室(FAIR),并于2018年與杰弗里·辛頓、約書亞·本吉奧共同斬獲圖靈獎。如今,他再次以“孤獨先知”的姿態,挑戰行業共識,試圖為AI發展開辟新路徑。
值得注意的是,楊立昆的探索并非孤立無援。AI領域另一位頂尖學者、ImageNet創造者李飛飛,近期也通過新公司World Labs推出模型Marble,該模型能夠理解并生成3D環境,與“世界模型”理念不謀而合。李飛飛曾公開表示,未來需超越Transformer架構探索新模型,這與楊立昆的呼吁形成呼應。兩位權威學者的共識,或許預示著AI行業即將從LLM的“狂歡”中抽身,轉向更深層次的范式革新。
楊立昆的創業計劃尚未公布具體細節,但已引發廣泛關注。支持者認為,他的“世界模型”可能破解當前AI在物理世界交互中的瓶頸;質疑者則擔憂,這一路線是否具備技術可行性,或是否會因過于超前而難以落地。無論如何,這場由“AI教父”發起的挑戰,已為行業注入新的變量,其結果或將重新定義人工智能的未來方向。

















