滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

谷歌Gemini 3重磅登場，推理多模態(tài)能力超群，AI新紀元開啟

時間：2025-11-19 05:13:28 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

谷歌最新發(fā)布的Gemini 3人工智能模型引發(fā)行業(yè)震動，這款被定位為"推理+多模態(tài)+智能體開發(fā)"三合一的旗艦產(chǎn)品，在基準測試中展現(xiàn)出驚人實力。OpenAI首席執(zhí)行官薩姆·奧特曼在產(chǎn)品發(fā)布后迅速發(fā)布推文祝賀，側(cè)面印證了這場技術(shù)突破的分量。據(jù)內(nèi)部人士透露，奧特曼測試的可能是區(qū)分大小寫的特殊版本，這暗示著模型對細微語義差異的精準把握能力。

在核心性能指標方面，Gemini 3 Pro創(chuàng)造了多項紀錄：LMArena排行榜以1501分登頂，人類最后考試（HLE）取得37.5%的裸考成績，GPQA Diamond測試斬獲91.9%的準確率，MathArena Apex數(shù)學(xué)基準測試中達到23.4%的突破性表現(xiàn)。這些數(shù)據(jù)全面超越前代2.5 Pro，更將剛發(fā)布的GPT-5.1甩在身后。增強版的Deep Think模式在HLE和GPQA測試中分別達到41%和93.8%的優(yōu)異成績，ARC-AGI-2測試更以45.1%刷新歷史紀錄。

多模態(tài)處理能力是該模型的另一大亮點。MMMU-Pro測試獲得81%的高分，視頻理解基準Video-MMMU達到87.6%的準確率，SimpleQA Verified事實核查測試中取得72.1%的業(yè)界領(lǐng)先成績。這些突破意味著模型能同時處理文本、圖像、視頻、代碼等多種信息形態(tài)，在復(fù)雜場景下展現(xiàn)出博士級的推理水準。例如，該模型可以解析長視頻內(nèi)容，將學(xué)術(shù)論文轉(zhuǎn)化為互動指南，甚至破譯不同語言的手寫食譜并生成數(shù)字化家庭菜譜。

在智能體開發(fā)領(lǐng)域，Gemini 3實現(xiàn)了質(zhì)的飛躍。WebDev Arena排行榜以1487分強勢登頂，Terminal-Bench 2.0終端操作測試獲得54.2%的高分，SWE-bench Verified編碼智能體測試達到76.2%的準確率。開發(fā)者演示顯示，模型僅憑單個文本提示就能生成功能完整的3D樂高編輯器，包含復(fù)雜的空間邏輯和交互界面。更令人驚嘆的是，它成功復(fù)現(xiàn)了經(jīng)典iOS游戲《荒謬釣魚》，包含音效和背景音樂，甚至構(gòu)建出可運行的Game Boy模擬器并自動繪制設(shè)備外觀。

長程規(guī)劃能力測試中，Vending-Bench 2排行榜見證了模型在復(fù)雜商業(yè)場景下的決策實力。通過持續(xù)工具使用和策略調(diào)整，Gemini 3 Pro在模擬運營年度中實現(xiàn)更高回報率，展現(xiàn)出處理多步驟工作流的強大能力。實際應(yīng)用場景包括自動預(yù)訂本地服務(wù)、智能整理電子郵件等，用戶只需把控方向即可由模型完成具體執(zhí)行。

技術(shù)架構(gòu)方面，該模型支持百萬token的超大上下文窗口，整合了先進的推理引擎、視覺空間理解和多語言處理模塊。訓(xùn)練過程完全基于谷歌TPU集群完成，展現(xiàn)出強大的硬件協(xié)同優(yōu)勢。開發(fā)者可通過Google AI Studio、Vertex AI、Gemini CLI等平臺調(diào)用模型，第三方集成涵蓋Cursor、GitHub、JetBrains等主流工具鏈。

伴隨產(chǎn)品發(fā)布的還有革命性的智能體開發(fā)平臺Google Antigravity。該平臺將AI協(xié)作從工具層面提升至戰(zhàn)略層面，開發(fā)者可以任務(wù)維度與智能體交互，通過專用界面同時訪問編輯器、終端和瀏覽器。演示案例中，智能體自主規(guī)劃并完成了飛行跟蹤應(yīng)用程序的端到端開發(fā)，包括代碼編寫、瀏覽器操作和結(jié)果驗證等全流程。平臺還集成了2.5代計算機使用模型和圖像編輯組件，形成完整的開發(fā)生態(tài)系統(tǒng)。

Alexander 表示，人類的打字速度將成為通用人工智能（AGI）的發(fā)展瓶頸，主要原因是人們?nèi)孕枰ㄟ^寫提示詞（Prompt）來引導(dǎo)AI，并親自檢查、驗證 AI 的輸出結(jié)果。 IT之家注：通用人工智能（…

12-15

海歸博士胡宇航創(chuàng)辦首形科技獲中網(wǎng)投螞蟻集團等聯(lián)合領(lǐng)投新一輪融資

瑞財經(jīng) 吳文婷12月12日，首形科技（AheadForm）宣布完成新一輪融資。本輪由中國互聯(lián)網(wǎng)投資基金（中網(wǎng)投）與螞蟻集團聯(lián)合領(lǐng)投，其他投資人包括上海未來產(chǎn)業(yè)基金、東方富海，老股東招商局創(chuàng)投持續(xù)超額追投，深…

12-15

OpenAI負責(zé)人：人類編寫提示詞與驗證速度或成AGI突破關(guān)鍵阻礙

Alexander 表示，人類的打字速度將成為通用人工智能（AGI）的發(fā)展瓶頸，主要原因是人們?nèi)孕枰ㄟ^寫提示詞（Prompt）來引導(dǎo)AI，并親自檢查、驗證 AI 的輸出結(jié)果。 IT之家注：通用人工智能（…

12-15

OpenAI負責(zé)人：人類打字速度或成AGI掣肘，全自動化流程有望突破瓶頸

12-15

海辰儲能第三屆生態(tài)日：首發(fā)三項成果，劍指儲能“1毛錢時代”

12-15

Aetherflux太空數(shù)據(jù)中心Galactic Brain，2027啟發(fā)射

12-15

ChatGPT成人模式最快明年一季度上線！正測試年齡驗證

12-15

OpenAI：人類打字速度將成通用人工智能發(fā)展瓶頸

12-15

Aetherflux推出Galactic Brain太空數(shù)據(jù)中心，2027年首顆衛(wèi)星將發(fā)射啟用

12-15

ChatGPT“成人模式”或2026年首季上線年齡驗證測試正推進

12-15

大同世界磁電科技宣布：地磁能發(fā)電技術(shù)將量產(chǎn)，汽車續(xù)航難題或迎突破

12-15

萬元以內(nèi)首款高性能機器人！松延動力獲1000臺小布米Bumi訂單

12-15

燃油車新標桿！邁騰2026款以智慧進化續(xù)寫德系傳奇

12-15

松延動力新款小布米Bumi獲1000臺訂單，萬元內(nèi)高性能人形機器人受青睞

12-15

OpenAI新開源模型：99.9%權(quán)重為零，稀疏性技術(shù)或改寫大模型未來

反觀Circuit Sparsity，追求的是模型原生的稀疏性，通過把特征投射到超大維度，再嚴格限制有效激活的節(jié)點數(shù)量，從設(shè)計上就讓每個特征變得單義、正交，從根源上解決了傳統(tǒng)模型一個概念分散在多個節(jié)點的疊加…

12-15

點擊查看更多 +

全站最新

雷軍回應(yīng)“準新車”引爭議，運損車貼新標，消費者質(zhì)疑誠意與責(zé)任

雷軍詳解小米“準新車”開售，全年交付量有望突破40萬輛大關(guān)

新邁騰B9：智慧配置升級通勤體驗，多重福利助力輕松購車

知乎2025電Club新知技術(shù)大會：聚焦新能源，共探技術(shù)革新與信任構(gòu)建新路徑

特斯拉Robotaxi新突破：奧斯汀街頭開啟無安全員無乘員路測

汽車熄火剎車變硬別慌！行駛中突發(fā)熄火3步“保命”操作速收藏

熱門內(nèi)容

本欄最新

燃油車新標桿！邁騰2026款以智慧進化續(xù)寫德系傳奇

廣汽高域韶關(guān)新豐試飛基地授牌構(gòu)建飛行汽車測試新場景

全新深藍S07華為乾崑630長續(xù)航版：續(xù)航智能雙優(yōu)，重塑出行新體驗

極石ADAMAS將登場，增程中大型SUV，大氣外觀配6座7座，競爭力如何？

東方美學(xué)邂逅科技鋒芒，嵐圖泰山以全能實力重塑豪華SUV新格局

寶馬在華推出“蓋亞”AI平臺，以智能基座驅(qū)動全價值鏈協(xié)同升級

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

谷歌Gemini 3重磅登場，推理多模態(tài)能力超群，AI新紀元開啟

日本精品一区二区三区高清久久