在近期舉辦的智能未來行業(yè)峰會上,清華大學(xué)人工智能研究院常務(wù)副院長孫茂松就生成式人工智能與大模型的發(fā)展態(tài)勢發(fā)表深度見解。這場匯聚近三十位產(chǎn)業(yè)代表的盛會吸引線下觀眾近1500人,線上直播觀看量突破350萬次,引發(fā)主流媒體廣泛關(guān)注。
自2017年深度學(xué)習(xí)進(jìn)入預(yù)訓(xùn)練模型時代以來,人工智能領(lǐng)域僅用八年時間便完成數(shù)次技術(shù)躍遷。從2020年GPT-3的發(fā)布到ChatGPT的廣泛應(yīng)用,再到近期國產(chǎn)大模型的崛起,技術(shù)迭代速度遠(yuǎn)超預(yù)期。孫茂松特別指出,大模型最引人入勝的特性在于其非線性發(fā)展規(guī)律——當(dāng)模型參數(shù)突破臨界點(diǎn)時,性能提升往往呈現(xiàn)指數(shù)級增長,這種不可預(yù)測性既帶來機(jī)遇也暗藏風(fēng)險。
當(dāng)前人工智能發(fā)展已形成顯著優(yōu)勢領(lǐng)域。在標(biāo)準(zhǔn)化學(xué)術(shù)測試方面,頂尖模型在"人類終極考試"中取得三四十分,遠(yuǎn)超人類專家的平均水平。代碼生成領(lǐng)域更出現(xiàn)顛覆性突破,今年國際大學(xué)生程序設(shè)計競賽中,人類冠軍團(tuán)隊(duì)已不敵大模型選手。多模態(tài)交互能力的突破,為人工智能從文本世界向物理世界延伸奠定基礎(chǔ)。
技術(shù)突破背后潛藏著深層挑戰(zhàn)。孫茂松引用控制論創(chuàng)始人維納的觀點(diǎn)強(qiáng)調(diào),真正的智能必須具備環(huán)境感知與交互能力。當(dāng)前語言模型雖在"言說"層面接近通過圖靈測試,但在"認(rèn)知"維度仍存在根本性缺陷。他形象比喻道:"現(xiàn)有模型掌握七八成知識,卻缺乏體系化理解,如同背熟百科全書卻不知如何運(yùn)用。"這種"知行斷層"成為制約具身智能發(fā)展的關(guān)鍵瓶頸。
行業(yè)面臨的現(xiàn)實(shí)困境在資本層面尤為突出。法國《回聲報》披露,OpenAI計劃將計算能力提升至250GW,相當(dāng)于250個核反應(yīng)堆的發(fā)電量,預(yù)計投資規(guī)模達(dá)10萬億美元。這種激進(jìn)擴(kuò)張策略引發(fā)華爾街擔(dān)憂,暴露出技術(shù)路線的不確定性。孫茂松分析指出,任何技術(shù)系統(tǒng)發(fā)展到特定階段都會遭遇性能飽和,當(dāng)前大模型依賴的擴(kuò)展法則可能面臨失效風(fēng)險。
具身智能發(fā)展路徑引發(fā)學(xué)界熱議。針對空間智能理論,孫茂松提出關(guān)鍵質(zhì)疑:基于文本預(yù)測的Next Token機(jī)制能否適用于四維物理世界?他以圖像識別為例說明,3×3像素塊可能對應(yīng)衣物補(bǔ)丁、桌面一角或屏幕圖標(biāo),語義不確定性遠(yuǎn)超文本序列。這種復(fù)雜性使得人形機(jī)器人在開放環(huán)境執(zhí)行復(fù)雜任務(wù)的前景堪憂,圖靈獎得主Hinton關(guān)于AI就業(yè)影響的論述從側(cè)面印證了這一判斷。
面對技術(shù)發(fā)展的不確定性,孫茂松提出差異化競爭策略。他借用"致廣大而盡精微"的古訓(xùn),建議國內(nèi)產(chǎn)業(yè)布局采取雙軌并行模式:少數(shù)頂尖團(tuán)隊(duì)持續(xù)追蹤國際前沿技術(shù),多數(shù)企業(yè)應(yīng)深耕垂直領(lǐng)域應(yīng)用。以國產(chǎn)開源模型為基礎(chǔ)的產(chǎn)業(yè)融合已顯現(xiàn)優(yōu)勢,在智能制造、醫(yī)療診斷等場景中,針對性優(yōu)化往往能催生創(chuàng)新算法。這種"精微"之路不僅風(fēng)險可控,更可能反向推動基礎(chǔ)理論突破。
這場思想交鋒為行業(yè)指明務(wù)實(shí)方向。與會專家普遍認(rèn)同,在算力競賽日趨白熱化的背景下,聚焦特定場景的深度開發(fā)既是現(xiàn)實(shí)選擇,也是突破技術(shù)瓶頸的有效路徑。正如孫茂松所言:"垂直領(lǐng)域的精耕細(xì)作,或許能孕育出改變游戲規(guī)則的顛覆性創(chuàng)新。"這種戰(zhàn)略定力,或?qū)Q定中國人工智能產(chǎn)業(yè)的未來走向。











