近日,人工智能領(lǐng)域迎來一則引人矚目的消息:月之暗面(Moonshot AI)于本周四正式推出其最新開源思考模型——Kimi K2 Thinking。這款模型憑借卓越性能,在多項基準(zhǔn)測試中表現(xiàn)突出,甚至超越了多家科技巨頭投入數(shù)十億美元研發(fā)的先進(jìn)模型。
據(jù)月之暗面官方介紹,Kimi K2 Thinking在被稱為“人類終極考試”(HLE)的測試中取得了44.9%的優(yōu)異成績。這一成績不僅超越了GPT-5、Grok-4、Claude 4.5等知名模型,更標(biāo)志著開源模型在復(fù)雜推理任務(wù)中的競爭力達(dá)到新高度。HLE測試涵蓋邏輯推理、數(shù)學(xué)計算、跨學(xué)科知識應(yīng)用等多個維度,被視為評估AI模型綜合能力的權(quán)威標(biāo)準(zhǔn)之一。
值得關(guān)注的是,Kimi K2 Thinking的研發(fā)成本顯著低于行業(yè)預(yù)期。據(jù)CNBC援引知情人士透露,該模型的訓(xùn)練總投入僅為460萬美元(按當(dāng)前匯率約合3277萬元人民幣),甚至低于同期發(fā)布的DeepSeek V3(560萬美元)。與之形成鮮明對比的是,OpenAI等科技巨頭在相關(guān)領(lǐng)域的研發(fā)投入高達(dá)數(shù)十億美元。這種“低成本高產(chǎn)出”的模式,為AI行業(yè)的技術(shù)迭代提供了全新思路。
與市場上多數(shù)閉源模型不同,Kimi K2 Thinking采用完全開源策略。月之暗面不僅公開了模型權(quán)重、訓(xùn)練腳本和數(shù)據(jù)配比方案,還提供了完整的評估工具鏈,并允許商業(yè)用途。這一舉措大幅降低了開發(fā)者使用門檻,使得中小企業(yè)和研究機(jī)構(gòu)也能基于該模型進(jìn)行二次開發(fā),推動了AI技術(shù)的普惠化進(jìn)程。
業(yè)內(nèi)專家指出,Kimi K2 Thinking的發(fā)布標(biāo)志著開源模型在性能與成本平衡上取得突破性進(jìn)展。其成功不僅驗證了高效訓(xùn)練方法的可能性,也為全球AI社區(qū)提供了可復(fù)制的技術(shù)路徑。隨著模型代碼和工具的全面開放,預(yù)計將引發(fā)新一輪基于該架構(gòu)的創(chuàng)新應(yīng)用開發(fā)浪潮。













