一個(gè)月前,谷歌發(fā)布了最新的 Gemini,從此我們進(jìn)入了 Gemini 3 的時(shí)代。
那以后, Gemini 3 Pro 就成了我干活的主力。
但說(shuō)實(shí)話,它反應(yīng)是真慢,而且很多時(shí)候我只是問(wèn)些簡(jiǎn)單問(wèn)題,完全沒(méi)必要深度思考。
所以,一直期待速度飛快的 Flash 系列重新回來(lái)。
終于,在今天,Gemini 3 Flash 來(lái)了!
圖:谷歌 CEO 宣布 Gemini 3 Flash 發(fā)布
谷歌這一波操作屬實(shí)把我驚到了。
官方號(hào)稱它“比快更快”,而且智商不減反增。
本來(lái)是一個(gè)“小弟”人設(shè),但你看看它排名,居然僅次于OpenAI 最新的模型 GPT 5.2了。(就差 2 分
)
真讓人情何以堪吶?
圖:第三方機(jī)構(gòu)評(píng)測(cè) Gemini 3 Flash 的綜合指標(biāo)
廢話不多說(shuō),咱們趕緊來(lái)扒一扒,這個(gè)新出的 Flash 到底香不香。
01 到底是個(gè)啥?
簡(jiǎn)單來(lái)說(shuō):把 Pro 的腦子,裝進(jìn)了 Flash 的身體里。
以前我們對(duì)“Flash(輕量級(jí))”模型的印象是什么?
跑得快,便宜,但是……有點(diǎn)“笨”。處理復(fù)雜任務(wù)時(shí)經(jīng)常翻車(chē)。
但這次 Gemini 3 Flash 徹底打破了這個(gè)刻板印象。
遇到閑聊、簡(jiǎn)單查詢: 它就輕裝上陣,秒回,省流又省錢(qián);
遇到燒腦難題: 它能立馬調(diào)動(dòng)深層算力,像老教授一樣深思熟慮。
它大腦似乎有個(gè)變速箱。
它甚至在性能、成本和速度方面突破了帕累托極限。(AI 界的性價(jià)比極限)
圖:Gemini 3 Flash 在性能、成本和速度方面突破了帕累托極限
官方數(shù)據(jù)顯示,它的 Token 消耗比 Gemini 2.5 Pro 少了 30%,但智商卻在線。
說(shuō)人話就是:多快好省!
圖:Token 消耗率對(duì)比
這種“該省省,該花花”的 AI,誰(shuí)不愛(ài)?
02 憑數(shù)據(jù)說(shuō)話:這波“以下犯上”有點(diǎn)狠
咱們不整那些虛頭巴腦的形容詞,直接看跑分?jǐn)?shù)據(jù),谷歌這次是真的下了血本。
我看了一眼實(shí)測(cè)數(shù)據(jù),甚至有點(diǎn)不敢相信:它在很多任務(wù)上接近自家最強(qiáng)的模型 3 Pro,甚至有些指標(biāo)還干掉了Pro 版。(這樣禮貌嗎?
)
特別是那個(gè)讓無(wú)數(shù) AI 汗流浹背的 ARC-AGI-2 測(cè)試……
還讓人意想不到的是:Gemini 3 Flash 全面碾壓了上一代的旗艦版本 2.5 Pro。(前浪死在沙灘上
)
圖: Gemini 3 Flash 的各項(xiàng)指標(biāo)
先說(shuō)說(shuō)這個(gè) ARC-AGI-2。
之前 GPT 5.2 發(fā)布讓大家印象深刻,其中有一個(gè)原因就是這個(gè)指標(biāo)碾壓所有模型。
老粉都知道,ARC 評(píng)測(cè)集是 AI 圈最難啃的骨頭,甚至沒(méi)有之一, 主要測(cè)試模型到底有沒(méi)有腦子。
它是由 Keras 之父 François Chollet 搞出來(lái)的,專門(mén)用來(lái)反死記硬背的。
比如這種題目:
圖:ARC-AGI 2 題目
以前的模型,MMLU 這種考試能拿 90 分,一碰到 ARC 這種需要“舉一反三”的智力題,立馬現(xiàn)原形,得分低得可憐。
這項(xiàng)指標(biāo) Flash 竟然超過(guò)了自己的 Pro 大哥,僅次于 GPT-5.2!
這個(gè)小弟,要造反了有點(diǎn)腦子!
在另一項(xiàng)指標(biāo): GPQA Diamond(研究生級(jí)別的專家推理測(cè)試)里,它拿了 90.4 分。
意思就是智商堪比博士。
看這個(gè)數(shù)字,它的推理能力已經(jīng)和那些大塊頭的前沿模型(Pro 版)平起平坐了。
在著名的“Humanity's Last Exam(人類最后一場(chǎng)考試)”這種地獄級(jí)難度的測(cè)試?yán)铮珿emini 3 Flash 居然考出了 43.5% 的高分(Tools on 模式)。
圖:HLE 分?jǐn)?shù)對(duì)比
它跟 GPT-5.2(45.5%)這種超級(jí)旗艦?zāi)P停徊盍瞬坏?2 分!
朋友們,別忘了,這可是一個(gè) Flash 模型啊!
它的定位本來(lái)是“跑腿小弟”,結(jié)果一不小心把“業(yè)界大佬”們的飯碗給砸了。(面子?不存在的。
)
這哪里是“輕量版”,這分明是“披著閃電俠外衣的超人”。
在多模態(tài)測(cè)試(MMMU Pro)中得分 81.2%,看圖、看視頻的能力基本和 Gemini 3 Pro 五五開(kāi)。
也就是,眼神兒更好使。
圖:MMMU-Pro 指標(biāo)對(duì)比
最讓我意外的是這個(gè)——在 SWE-bench Verified(代碼智能體測(cè)試)中,它得分 78%。
直接超越了 Gemini 2.5 全系,甚至在某些這就需要改代碼的任務(wù)上,比 Gemini 3 Pro 還要好用!
本來(lái)以為它動(dòng)動(dòng)嘴還行,沒(méi)想到寫(xiě)代碼更溜!
一句話總結(jié):它不是“丐版”,它是“精簡(jiǎn)版戰(zhàn)神”。
03 為什么我建議你立馬換用 Flash?
作為這一年多幾乎天天都在用 AI 的人,我覺(jué)得 Gemini 3 Flash 帶來(lái)的改變是肉眼可見(jiàn)的:
1. 真的太快了!??
根據(jù)第三方測(cè)評(píng)(Artificial Analysis),它的速度是 2.5 Pro 的 3 倍。
自動(dòng)播放以前問(wèn) AI 一個(gè)問(wèn)題,你可能還得切出去回個(gè)消息等它寫(xiě)完。
現(xiàn)在?你字剛打完,它答案就懟到你臉上了。
這種“跟手”的感覺(jué),對(duì)于我們需要快速寫(xiě)文案、改代碼的人來(lái)說(shuō),簡(jiǎn)直是救命。
2. 價(jià)格那是相當(dāng)感人










