當(dāng)全球AI領(lǐng)域陷入“參數(shù)至上”的激烈競(jìng)爭(zhēng)時(shí),微博AI團(tuán)隊(duì)以一場(chǎng)顛覆性突破,為行業(yè)開辟了全新的發(fā)展路徑。近日,微博正式推出自主研發(fā)的開源大模型VibeThinker,這款僅含15億參數(shù)的“輕量級(jí)選手”,在國際權(quán)威數(shù)學(xué)競(jìng)賽基準(zhǔn)測(cè)試中,以驚人表現(xiàn)擊敗了參數(shù)規(guī)模達(dá)6710億的DeepSeek R1模型,引發(fā)全球AI研究界的廣泛關(guān)注。
在傳統(tǒng)認(rèn)知中,AI模型的參數(shù)量被視為衡量其能力的核心指標(biāo)。行業(yè)普遍認(rèn)為,復(fù)雜推理能力需要千億級(jí)參數(shù)支撐,小模型因參數(shù)不足難以應(yīng)對(duì)高難度任務(wù)。然而,微博AI團(tuán)隊(duì)通過優(yōu)化模型架構(gòu)與訓(xùn)練范式,創(chuàng)新提出“頻譜到信號(hào)原理”(SSP)訓(xùn)練方法,成功挖掘出小模型的隱藏潛力。VibeThinker在AIME24、AIME25及HMMT25等高難度數(shù)學(xué)測(cè)試中,表現(xiàn)超越參數(shù)量超其400倍的DeepSeek-R1-0120版本,與4560億參數(shù)的MiniMax-M1效果相當(dāng),甚至可媲美Gemini 2.5 flash和Claude Opus 4等頂尖模型。在編程算法測(cè)試集LiveCodeBench v6中,其成績也追平了歐洲領(lǐng)先AI企業(yè)Minstral.AI的Magistral-Medium-2506版本。
這一突破不僅重新定義了AI模型的評(píng)價(jià)標(biāo)準(zhǔn),更以極致的成本效益顛覆了行業(yè)格局。據(jù)公開數(shù)據(jù),2025年主流大模型單次后訓(xùn)練成本普遍在數(shù)十萬美元級(jí)別。例如,上海AI企業(yè)MiniMax今年6月發(fā)布的M1模型,訓(xùn)練成本約53.5萬美元;DeepSeek的R1模型訓(xùn)練總成本(含基礎(chǔ)模型開發(fā))約630萬美元。相比之下,VibeThinker的后訓(xùn)練過程(含SFT和RL階段)僅消耗3900個(gè)GPU小時(shí),按市場(chǎng)租賃價(jià)格計(jì)算,總成本僅7800美元,成本效益比達(dá)到30至60倍。這一優(yōu)勢(shì)意味著,前沿AI技術(shù)不再為科技巨頭所壟斷,中小型機(jī)構(gòu)和研究團(tuán)隊(duì)也能以極低門檻參與創(chuàng)新,推動(dòng)行業(yè)向更開放、多元的方向發(fā)展。
技術(shù)突破的最終價(jià)值在于落地應(yīng)用。微博已將AI技術(shù)深度融入平臺(tái)生態(tài),構(gòu)建起覆蓋多場(chǎng)景的智能服務(wù)體系。2024年,微博自主研發(fā)的“知微”大語言模型通過備案,并陸續(xù)推出智搜、內(nèi)容總結(jié)、AI互動(dòng)號(hào)等功能。其中,微博智搜通過分析平臺(tái)海量內(nèi)容構(gòu)建可信知識(shí)圖譜,實(shí)現(xiàn)精準(zhǔn)需求捕捉與情感場(chǎng)景理解,6月月活躍用戶突破5000萬;評(píng)論羅伯特作為AI互動(dòng)賬號(hào),從毒舌風(fēng)格進(jìn)化出溫情與聰明版本,全網(wǎng)粉絲近200萬,成為用戶熱議的交流對(duì)象。
隨著VibeThinker的發(fā)布,微博AI戰(zhàn)略邁入新階段。公司計(jì)劃深度融合心理等垂直領(lǐng)域的數(shù)據(jù)資產(chǎn),打造更懂公眾情緒、更能服務(wù)社會(huì)需求的專屬模型。這一模型不僅將優(yōu)化現(xiàn)有AI產(chǎn)品體驗(yàn),更可能裂變出兼具社交屬性與智能服務(wù)的全新生態(tài)。例如,VibeThinker的技術(shù)有望降低微博智搜的算力損耗和實(shí)時(shí)互動(dòng)場(chǎng)景的AI響應(yīng)成本,使平臺(tái)在規(guī)模化投入AI能力時(shí)無需承擔(dān)過高資源壓力,進(jìn)一步釋放生態(tài)創(chuàng)新能力。
目前,VibeThinker仍處于實(shí)驗(yàn)性版本階段,其研發(fā)重點(diǎn)聚焦于強(qiáng)化小模型在數(shù)學(xué)與編程領(lǐng)域的能力,尚未針對(duì)日常聊天等場(chǎng)景進(jìn)行優(yōu)化。但這一探索已為AI產(chǎn)業(yè)提供了全新思路:通過算法創(chuàng)新而非單純堆砌參數(shù),小模型同樣能實(shí)現(xiàn)高性能與低成本的雙贏,為行業(yè)從“規(guī)模競(jìng)賽”轉(zhuǎn)向“效率革命”奠定基礎(chǔ)。










