人工智能領(lǐng)域迎來重要進(jìn)展,DeepSeek正式推出兩款全新AI模型——DeepSeek-V3.2與DeepSeek-V3.2-Speciale。其中V3.2主打日常應(yīng)用場(chǎng)景,在推理性能與輸出效率上實(shí)現(xiàn)突破;Speciale版本則聚焦極限推理能力,在國際頂級(jí)競(jìng)賽中斬獲多項(xiàng)金牌。這一成果標(biāo)志著開源模型與閉源商業(yè)模型的技術(shù)差距進(jìn)一步縮小。
在核心性能方面,DeepSeek-V3.2展現(xiàn)出顯著優(yōu)勢(shì)。公開測(cè)試數(shù)據(jù)顯示,該模型推理能力達(dá)到GPT-5水平,僅略遜于Gemini-3.0-Pro。與同類產(chǎn)品Kimi-K2-Thinking相比,其輸出長度減少40%以上,計(jì)算開銷降低35%,用戶等待時(shí)間縮短近半。官方渠道已全面升級(jí),網(wǎng)頁端、移動(dòng)應(yīng)用及API服務(wù)均完成版本迭代。
增強(qiáng)版V3.2-Speciale在數(shù)學(xué)與編程領(lǐng)域創(chuàng)造歷史性突破。該模型不僅在IMO 2025、CMO 2025、ICPC全球總決賽及IOI國際競(jìng)賽中包攬金牌,更在ICPC與IOI項(xiàng)目中分別達(dá)到人類選手第二名與第十名的競(jìng)技水平。技術(shù)團(tuán)隊(duì)通過融合DeepSeek-Math-V2的定理證明模塊,使模型具備嚴(yán)謹(jǐn)?shù)倪壿嬺?yàn)證能力。不過研發(fā)團(tuán)隊(duì)特別說明,該版本處理復(fù)雜任務(wù)時(shí)Token消耗量是標(biāo)準(zhǔn)版的3倍,目前僅開放研究用途,暫不支持工具調(diào)用功能。
技術(shù)創(chuàng)新層面,V3.2首次實(shí)現(xiàn)思考模式與工具調(diào)用的深度整合。通過構(gòu)建包含1800個(gè)虛擬環(huán)境、8.5萬條復(fù)雜指令的強(qiáng)化學(xué)習(xí)體系,模型在智能體任務(wù)中的表現(xiàn)超越所有開源競(jìng)品。測(cè)試數(shù)據(jù)顯示,其在未針對(duì)特定工具優(yōu)化的條件下,工具調(diào)用準(zhǔn)確率較前代提升27%,與閉源模型的差距縮小至8個(gè)百分點(diǎn)。技術(shù)報(bào)告披露,這種訓(xùn)練方法顯著增強(qiáng)了模型的泛化能力。
在應(yīng)用適配方面,V3.2推出雙模式運(yùn)行機(jī)制。用戶可根據(jù)需求選擇標(biāo)準(zhǔn)模式或思考模式,后者支持多輪工具調(diào)用與邏輯推演。API服務(wù)新增對(duì)Claude Code生態(tài)的支持,開發(fā)者可通過簡單配置啟用深度思考功能。不過研發(fā)團(tuán)隊(duì)提醒,非標(biāo)準(zhǔn)工具組件如Cline、RooCode仍需使用非思考模式,相關(guān)適配工作正在推進(jìn)中。
開源社區(qū)同步迎來重要更新。兩款模型的完整代碼與訓(xùn)練數(shù)據(jù)集已在HuggingFace和ModelScope平臺(tái)開放下載,技術(shù)白皮書詳細(xì)披露了DSA稀疏注意力機(jī)制等核心算法。為促進(jìn)學(xué)術(shù)研究,Speciale版本的臨時(shí)API服務(wù)將持續(xù)開放至12月中旬,期間保持原有定價(jià)體系,最大輸出長度擴(kuò)展至128K字符。
實(shí)驗(yàn)性版本V3.2-Exp的驗(yàn)證結(jié)果為本次發(fā)布提供重要依據(jù)。兩個(gè)月前的用戶對(duì)比測(cè)試顯示,該版本在32個(gè)典型場(chǎng)景中的表現(xiàn)均不弱于前代旗艦?zāi)P蚔3.1-Terminus,特別在長文本處理場(chǎng)景中展現(xiàn)出顯著優(yōu)勢(shì)。這些反饋數(shù)據(jù)直接推動(dòng)了稀疏注意力機(jī)制的優(yōu)化升級(jí),最終促成新一代模型的誕生。











