滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

Gemini 3 Flash 突襲：跑腿小弟差點(diǎn)打敗了GPT-5.2

時(shí)間：2025-12-18 08:02:20 來(lái)源：愛(ài)范兒編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

一個(gè)月前，谷歌發(fā)布了最新的 Gemini，從此我們進(jìn)入了 Gemini 3 的時(shí)代。

那以后， Gemini 3 Pro 就成了我干活的主力。

但說(shuō)實(shí)話，它反應(yīng)是真慢，而且很多時(shí)候我只是問(wèn)些簡(jiǎn)單問(wèn)題，完全沒(méi)必要深度思考。

所以，一直期待速度飛快的 Flash 系列重新回來(lái)。

終于，在今天，Gemini 3 Flash 來(lái)了！

圖：谷歌 CEO 宣布 Gemini 3 Flash 發(fā)布

谷歌這一波操作屬實(shí)把我驚到了。

官方號(hào)稱它“比快更快”，而且智商不減反增。

本來(lái)是一個(gè)“小弟”人設(shè)，但你看看它排名，居然僅次于OpenAI 最新的模型 GPT 5.2了。（就差 2 分

）

真讓人情何以堪吶？

圖：第三方機(jī)構(gòu)評(píng)測(cè) Gemini 3 Flash 的綜合指標(biāo)

廢話不多說(shuō)，咱們趕緊來(lái)扒一扒，這個(gè)新出的 Flash 到底香不香。

01 到底是個(gè)啥？

簡(jiǎn)單來(lái)說(shuō)：把 Pro 的腦子，裝進(jìn)了 Flash 的身體里。

以前我們對(duì)“Flash（輕量級(jí)）”模型的印象是什么？

跑得快，便宜，但是……有點(diǎn)“笨”。處理復(fù)雜任務(wù)時(shí)經(jīng)常翻車(chē)。

但這次 Gemini 3 Flash 徹底打破了這個(gè)刻板印象。

遇到閑聊、簡(jiǎn)單查詢：它就輕裝上陣，秒回，省流又省錢(qián)；

遇到燒腦難題：它能立馬調(diào)動(dòng)深層算力，像老教授一樣深思熟慮。

它大腦似乎有個(gè)變速箱。

它甚至在性能、成本和速度方面突破了帕累托極限。（AI 界的性價(jià)比極限）

圖：Gemini 3 Flash 在性能、成本和速度方面突破了帕累托極限

官方數(shù)據(jù)顯示，它的 Token 消耗比 Gemini 2.5 Pro 少了 30%，但智商卻在線。

說(shuō)人話就是：多快好省！

圖：Token 消耗率對(duì)比

這種“該省省，該花花”的 AI，誰(shuí)不愛(ài)？

02 憑數(shù)據(jù)說(shuō)話：這波“以下犯上”有點(diǎn)狠

咱們不整那些虛頭巴腦的形容詞，直接看跑分?jǐn)?shù)據(jù)，谷歌這次是真的下了血本。

我看了一眼實(shí)測(cè)數(shù)據(jù)，甚至有點(diǎn)不敢相信：它在很多任務(wù)上接近自家最強(qiáng)的模型 3 Pro，甚至有些指標(biāo)還干掉了Pro 版。（這樣禮貌嗎？

）

特別是那個(gè)讓無(wú)數(shù) AI 汗流浹背的 ARC-AGI-2 測(cè)試……

還讓人意想不到的是：Gemini 3 Flash 全面碾壓了上一代的旗艦版本 2.5 Pro。（前浪死在沙灘上

）

圖： Gemini 3 Flash 的各項(xiàng)指標(biāo)

先說(shuō)說(shuō)這個(gè) ARC-AGI-2。

之前 GPT 5.2 發(fā)布讓大家印象深刻，其中有一個(gè)原因就是這個(gè)指標(biāo)碾壓所有模型。

老粉都知道，ARC 評(píng)測(cè)集是 AI 圈最難啃的骨頭，甚至沒(méi)有之一，主要測(cè)試模型到底有沒(méi)有腦子。

它是由 Keras 之父 François Chollet 搞出來(lái)的，專門(mén)用來(lái)反死記硬背的。

比如這種題目：

圖：ARC-AGI 2 題目

以前的模型，MMLU 這種考試能拿 90 分，一碰到 ARC 這種需要“舉一反三”的智力題，立馬現(xiàn)原形，得分低得可憐。

這項(xiàng)指標(biāo) Flash 竟然超過(guò)了自己的 Pro 大哥，僅次于 GPT-5.2！

這個(gè)小弟，要造反了有點(diǎn)腦子！

在另一項(xiàng)指標(biāo)： GPQA Diamond（研究生級(jí)別的專家推理測(cè)試）里，它拿了 90.4 分。

意思就是智商堪比博士。

看這個(gè)數(shù)字，它的推理能力已經(jīng)和那些大塊頭的前沿模型（Pro 版）平起平坐了。

在著名的“Humanity's Last Exam（人類最后一場(chǎng)考試）”這種地獄級(jí)難度的測(cè)試?yán)铮珿emini 3 Flash 居然考出了 43.5% 的高分（Tools on 模式）。

圖：HLE 分?jǐn)?shù)對(duì)比

它跟 GPT-5.2（45.5%）這種超級(jí)旗艦?zāi)Ｐ停徊盍瞬坏?2 分！

朋友們，別忘了，這可是一個(gè) Flash 模型啊！

它的定位本來(lái)是“跑腿小弟”，結(jié)果一不小心把“業(yè)界大佬”們的飯碗給砸了。（面子？不存在的。

）

這哪里是“輕量版”，這分明是“披著閃電俠外衣的超人”。

在多模態(tài)測(cè)試（MMMU Pro）中得分 81.2%，看圖、看視頻的能力基本和 Gemini 3 Pro 五五開(kāi)。

也就是，眼神兒更好使。

圖：MMMU-Pro 指標(biāo)對(duì)比

最讓我意外的是這個(gè)——在 SWE-bench Verified（代碼智能體測(cè)試）中，它得分 78%。

直接超越了 Gemini 2.5 全系，甚至在某些這就需要改代碼的任務(wù)上，比 Gemini 3 Pro 還要好用！

本來(lái)以為它動(dòng)動(dòng)嘴還行，沒(méi)想到寫(xiě)代碼更溜！

一句話總結(jié)：它不是“丐版”，它是“精簡(jiǎn)版戰(zhàn)神”。

03 為什么我建議你立馬換用 Flash？

作為這一年多幾乎天天都在用 AI 的人，我覺(jué)得 Gemini 3 Flash 帶來(lái)的改變是肉眼可見(jiàn)的：

1. 真的太快了！??

根據(jù)第三方測(cè)評(píng)（Artificial Analysis），它的速度是 2.5 Pro 的 3 倍。

自動(dòng)播放

以前問(wèn) AI 一個(gè)問(wèn)題，你可能還得切出去回個(gè)消息等它寫(xiě)完。

現(xiàn)在？你字剛打完，它答案就懟到你臉上了。

這種“跟手”的感覺(jué)，對(duì)于我們需要快速寫(xiě)文案、改代碼的人來(lái)說(shuō)，簡(jiǎn)直是救命。

2. 價(jià)格那是相當(dāng)感人

12-18

Gemini 3 Flash可能是谷歌最狠的一步棋

12-18

馬斯克：xAI挺過(guò)未來(lái)兩三年將戰(zhàn)勝對(duì)手

12-18

工信部部長(zhǎng)會(huì)見(jiàn)AMD CEO蘇姿豐：希望繼續(xù)深耕中國(guó)市場(chǎng)

12-18

榮耀羅巍預(yù)告「視頻之王」：明年和大疆扳扳手腕

12-18

特斯拉申請(qǐng)新專利，讓汽車(chē)直連星鏈衛(wèi)星！

12-18

Gemini 3 Flash閃電來(lái)襲：智力竟反超Pro！速度快3倍，全球免費(fèi)

12-18

1人，1天，10集！Agent拉動(dòng)漫劇走進(jìn)加時(shí)賽

12-18

羅永浩回應(yīng)罵俞敏洪是忘恩負(fù)義：如沒(méi)去新東方命運(yùn)會(huì)更好，也可能會(huì)更差

12-18

大鵬談被搜狐辭退：對(duì)電影播放有分歧，沒(méi)有補(bǔ)償金

12-18

自2029年起YouTube將獨(dú)家直播奧斯卡頒獎(jiǎng)典禮

12-18

好特賣(mài)全國(guó)多地關(guān)店，部分城市新加盟叫停

12-18

階躍星辰推「Step-GUI」系列模型端云協(xié)同拓展GUI Agent能力邊界

12-18

長(zhǎng)征十二號(hào)甲箭在弦上，中國(guó)可復(fù)用火箭能否后來(lái)居上追趕美國(guó)？

不久前，中國(guó)的力箭一號(hào)遙十一火箭成功完成了一箭九星的發(fā)射，但在發(fā)射48小時(shí)后，SpaceX表示，中國(guó)的某顆衛(wèi)星差點(diǎn)與他們的STARLINK-6079衛(wèi)星發(fā)生碰撞。就中國(guó)的可重復(fù)使用運(yùn)載火箭來(lái)說(shuō)，盡…

12-18

猛禽3號(hào)引擎：以性能革新與復(fù)用突破，叩響高頻航天時(shí)代大門(mén)

它的終極戰(zhàn)場(chǎng)，是星艦?zāi)敲芗绶涑驳?3個(gè)引擎艙——在那里，極致的性能必須與閃電般的重復(fù)使用握手言和。所有這些絢爛的圖景，都系于一個(gè)核心：猛禽3號(hào)必須在真實(shí)的太空烈焰中，證明自己不僅是一臺(tái)性能怪獸，更是一位可靠…

12-18

點(diǎn)擊查看更多 +

全站最新

新銳品牌出海新路徑：精準(zhǔn)切入細(xì)分賽道，借平臺(tái)之力高效拓市場(chǎng)

硬派越野邂逅豪華格調(diào) 奔馳烏尼莫克80周年紀(jì)念版車(chē)型驚艷亮相

梅賽德斯-奔馳人事大變動(dòng)：28年老將瓦格納離任鮑迪比勒接棒新職

從車(chē)主到生態(tài)合伙人，iCAR以CLUB重構(gòu)車(chē)生活，V27引領(lǐng)家庭出行新玩法

全新軒逸實(shí)車(chē)亮相：運(yùn)動(dòng)外觀吸睛 1.6L自吸延續(xù) 家用市場(chǎng)再發(fā)力

蔚來(lái)ET5與ET5T遠(yuǎn)空套裝限定版來(lái)襲，獨(dú)特設(shè)計(jì)配強(qiáng)勁性能售價(jià)親民

熱門(mén)內(nèi)容

本欄最新

新銳品牌出海新路徑：精準(zhǔn)切入細(xì)分賽道，借平臺(tái)之力高效拓市場(chǎng)

歐拉5上市9.98萬(wàn)起！去性別化設(shè)計(jì)，續(xù)航動(dòng)力給力，家用代步新選擇

15萬(wàn)內(nèi)純電SUV怎么選？深藍(lán)S05與吉利銀河E5核心實(shí)力大比拼

韓路爆料：小米SU7換代2026年二季度登場(chǎng)，升級(jí)多項(xiàng)配置價(jià)格上調(diào)2萬(wàn)

觀測(cè)云2025可觀測(cè)日深圳站落幕：共探AI時(shí)代可觀測(cè)性新方向

抖音電商重拳出擊，“假打假真牟利”的流量生意走到了盡頭

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

Gemini 3 Flash 突襲：跑腿小弟差點(diǎn)打敗了GPT-5.2

日本精品一区二区三区高清久久