谷歌近日推出全新人工智能模型Gemini 3 Flash,以顯著低于市場主流產品的價格提供旗艦級性能表現。這款輕量級模型在編碼能力測試中超越Claude Sonnet 4.5,在多模態理解領域全面領先同類產品,部分指標甚至超過自家高端版本Gemini 3 Pro。
在科學推理基準測試GPQA Diamond中,新模型取得90.4%的準確率,較Claude Sonnet 4.5高出7個百分點,僅落后GPT-5.2約2個百分點。多模態評估平臺MMMU-Pro的測試顯示,其81.2%的得分不僅超過GPT-5.2的79.5%,更將Claude Sonnet 4.5甩開十多個百分點。在Humanity's Last Exam無工具測試中,該模型以33.7%的得分領先對手近20個百分點。
編碼能力測試成為最大亮點。在SWE-bench Verified評估中,新模型以78%的準確率首次超越自家Pro版本76.2%的得分,同時領先Claude Sonnet 4.5的77.2%。更引人注目的是其成本優勢——輸入價格僅為每百萬tokens 0.5美元,輸出價格3美元,分別相當于Claude的五分之一和GPT的四分之一。
實際應用場景驗證了模型的強大能力。某音視頻分析公司使用該模型進行深度偽造檢測時,發現其處理速度比前代2.5 Pro快4倍,能夠在不影響工作流的前提下實時分析復雜數據。開發者平臺數據顯示,新模型處理日常任務的token消耗平均減少30%,響應速度提升3倍。
用戶端升級計劃同步啟動。全球Gemini應用用戶將自動獲得模型更新,免費用戶可直接使用新模型的"極速模式"和"深度思考模式",專業模式則保留給3 Pro版本。搜索端的AI模式升級后,能更精準理解復雜查詢意圖,生成結構化回答的能力顯著增強。美國用戶還可選擇調用3 Pro進行深度計算,圖像生成模型Nano Banana Pro的開放范圍同步擴大。
開發者生態迎來重大利好。新模型已在Google AI Studio、Gemini API、Android Studio等平臺上線,Vertex AI企業版和全新推出的Antigravity開發平臺同步支持。針對高頻調用場景,Google推出Context Caching功能,可將重復token使用成本降低90%,批量處理API再降50%成本,同時提高調用配額。
產品矩陣完善成為關鍵布局。隨著Flash版本的加入,Gemini系列形成完整產品線:Pro版本專注極限推理,Deep Think強化深度計算,Flash版本主打高性價比。數據顯示,Gemini應用月活躍用戶已突破6.5億,開發者數量達1300萬,API調用量同比激增300%,用戶規模季度增長近45%。
行業觀察人士指出,這款新模型重新定義了輕量級產品的價值標準。測試表明,關閉深度思考模式的3 Flash性能仍優于開啟思考模式的2.5版本,標志著基礎模型能力實現質的飛躍。當旗艦級性能以五分之一的價格提供時,AI應用開發的成本結構將發生根本性改變。










