谷歌公司近日正式發(fā)布其最新一代大模型Gemini 3 Pro,這款由首席執(zhí)行官桑達(dá)爾·皮查伊與內(nèi)部團(tuán)隊共同推動研發(fā)的模型,被視為谷歌在人工智能領(lǐng)域的重要突破。據(jù)谷歌DeepMind負(fù)責(zé)人德米斯·哈薩比斯介紹,該模型研發(fā)過程中特別針對前代產(chǎn)品在編程、邏輯推理和數(shù)學(xué)運(yùn)算等領(lǐng)域的不足進(jìn)行了優(yōu)化,目標(biāo)是打造綜合性能更強(qiáng)的基礎(chǔ)模型。哈薩比斯在訪談中直言,Gemini 3 Pro是構(gòu)建通用人工智能(AGI)系統(tǒng)的關(guān)鍵組成部分。
谷歌副總裁喬希·伍德沃德在科技播客《Hard Fork》中透露,Gemini 3在處理復(fù)雜多步驟任務(wù)時展現(xiàn)出更強(qiáng)的邏輯連貫性,能夠更穩(wěn)定地維持思維鏈條。該模型還具備動態(tài)生成定制化交互界面的能力,例如自動生成互動式教程或嵌入式計算器。根據(jù)谷歌披露的數(shù)據(jù),Gemini應(yīng)用月活躍用戶已突破6.5億,若計入通過搜索功能接觸該模型的用戶,總月活人數(shù)達(dá)20億。為擴(kuò)大用戶群體,谷歌宣布向全美高校學(xué)生提供為期一年的Gemini高級版免費(fèi)使用權(quán)。
盡管Gemini 3正在全球范圍內(nèi)推廣應(yīng)用,哈薩比斯的研究重心已轉(zhuǎn)向更具挑戰(zhàn)性的技術(shù)領(lǐng)域——世界模型(World Models)。他透露,目前大部分研究精力都投入在該方向,并以SIMA 2智能體建模架構(gòu)和視頻生成模型Genie 3作為典型案例。這些模型已在谷歌內(nèi)部用于機(jī)器人訓(xùn)練,未來可能成為實(shí)現(xiàn)AGI的核心組件。哈薩比斯預(yù)測世界模型將迎來類似ChatGPT的爆發(fā)式增長,但當(dāng)前面臨成本高昂和技術(shù)瓶頸的雙重挑戰(zhàn)。他舉例稱,Genie模型的使用成本過高,且穩(wěn)定性難以維持超過一分鐘,這些問題需要在規(guī)模化應(yīng)用前得到解決。
在談到人工智能行業(yè)泡沫時,哈薩比斯表現(xiàn)出謹(jǐn)慎態(tài)度。他指出私募市場存在明顯泡沫現(xiàn)象,某些尚未推出實(shí)際產(chǎn)品的初創(chuàng)企業(yè)在種子輪融資階段就被估值數(shù)百億美元,這種估值邏輯缺乏可持續(xù)性。不過他強(qiáng)調(diào),谷歌憑借十二年前收購DeepMind時制定的長期戰(zhàn)略,已將人工智能研究深度融入搜索、YouTube和云服務(wù)等核心業(yè)務(wù),形成了獨(dú)特的競爭優(yōu)勢。哈薩比斯認(rèn)為,即便市場泡沫破裂,谷歌也具備足夠的抗風(fēng)險能力。
對于通用人工智能的實(shí)現(xiàn)時間表,哈薩比斯維持此前判斷,認(rèn)為仍需5至10年時間。他指出,當(dāng)前模型在可靠性、復(fù)雜推理和長期記憶等方面仍需突破性進(jìn)展。針對模型規(guī)模擴(kuò)張帶來的收益遞減現(xiàn)象,他解釋稱這并非意味著技術(shù)停滯,而是進(jìn)入穩(wěn)定提升階段。雖然性能增長不再呈現(xiàn)指數(shù)級躍升,但持續(xù)投入仍能帶來顯著改進(jìn),這種中間狀態(tài)的投資回報率依然可觀。
隨著模型能力不斷增強(qiáng),哈薩比斯特別提醒注意新型安全風(fēng)險。他以模型接入外部工具的函數(shù)調(diào)用功能為例,強(qiáng)調(diào)在網(wǎng)絡(luò)安全領(lǐng)域需要建立更嚴(yán)格的防護(hù)機(jī)制,防止技術(shù)被惡意利用。這種警示反映出谷歌在推進(jìn)人工智能技術(shù)時,對倫理和安全問題的持續(xù)關(guān)注。











