在AI科研領(lǐng)域,一場由中國團(tuán)隊(duì)引領(lǐng)的變革正在悄然發(fā)生。由上海交通大學(xué)人工智能學(xué)院、上海算法創(chuàng)新研究院與深勢科技聯(lián)合組建的SciMaster團(tuán)隊(duì),近日憑借其自主研發(fā)的AI機(jī)器學(xué)習(xí)專家ML-Master 2.0,在OpenAI設(shè)立的權(quán)威基準(zhǔn)測試MLE-bench中力壓國際科技巨頭,以56.44%的獎(jiǎng)牌率登頂全球榜首。這一突破不僅標(biāo)志著中國在AI驅(qū)動(dòng)科研領(lǐng)域的技術(shù)實(shí)力,更展現(xiàn)了國產(chǎn)開源大模型DeepSeek-V3.2-Speciale的強(qiáng)大潛力。
傳統(tǒng)AI在科研中的應(yīng)用往往局限于短程任務(wù),例如生成代碼或解答特定問題。然而,真實(shí)科研場景遠(yuǎn)比想象復(fù)雜:科研人員需要經(jīng)歷假設(shè)設(shè)定、實(shí)驗(yàn)設(shè)計(jì)、代碼調(diào)試、結(jié)果分析的完整閉環(huán),這個(gè)過程可能持續(xù)數(shù)小時(shí)甚至數(shù)天,且失敗是常態(tài)。SciMaster團(tuán)隊(duì)敏銳捕捉到這一痛點(diǎn),將ML-Master 2.0定位為“為真實(shí)機(jī)器學(xué)習(xí)工程而生”的自主智能體,其核心目標(biāo)是在無人工干預(yù)的條件下,實(shí)現(xiàn)超長程自主探索。
ML-Master 2.0的突破性在于其“超長程自主”能力。團(tuán)隊(duì)摒棄了將上下文視為一次性推理材料的傳統(tǒng)思路,轉(zhuǎn)而構(gòu)建了一套層次化認(rèn)知緩存(HCC)機(jī)制。該機(jī)制將科研過程中的認(rèn)知資產(chǎn)分為三個(gè)層級:即時(shí)經(jīng)驗(yàn)(Experience)服務(wù)于當(dāng)前決策,穩(wěn)定知識(Knowledge)在任務(wù)中反復(fù)調(diào)用,先驗(yàn)智慧(Wisdom)則跨任務(wù)遷移復(fù)用。通過動(dòng)態(tài)篩選和層級提升,系統(tǒng)既能避免“上下文爆炸”導(dǎo)致的混亂,又能防止“遺忘歷史”造成的重復(fù)試錯(cuò),從而在長達(dá)數(shù)十小時(shí)的探索中保持方向穩(wěn)定。
在MLE-bench的評測中,ML-Master 2.0展現(xiàn)了顯著優(yōu)勢。該基準(zhǔn)測試要求AI在真實(shí)機(jī)器學(xué)習(xí)工程場景中完成實(shí)驗(yàn)設(shè)計(jì)、代碼實(shí)現(xiàn)、調(diào)試修正等完整流程,其難度遠(yuǎn)超理想化的答題任務(wù)。測試結(jié)果顯示,ML-Master 2.0的獎(jiǎng)牌率較Google、meta等團(tuán)隊(duì)基于閉源模型的智能體提升28.3%,且全程無需人工干預(yù)。這一成績的取得,得益于其基于國產(chǎn)大模型DeepSeek-V3.2-Speciale的架構(gòu)優(yōu)化,以及HCC機(jī)制對長期試錯(cuò)經(jīng)驗(yàn)的高效積累。
目前,ML-Master 2.0已進(jìn)入實(shí)際應(yīng)用階段。在理論計(jì)算物理領(lǐng)域,它協(xié)助科研人員模擬復(fù)雜量子系統(tǒng),通過自主調(diào)整實(shí)驗(yàn)參數(shù),顯著縮短了模擬周期;在具身智能機(jī)器人訓(xùn)練中,其超長程自主能力使機(jī)器人能夠持續(xù)優(yōu)化動(dòng)作策略,無需頻繁人工重置。這些落地案例證明,ML-Master 2.0不僅能在評測中領(lǐng)先,更能解決真實(shí)科研中的關(guān)鍵問題。
為推動(dòng)技術(shù)普惠,SciMaster團(tuán)隊(duì)已將ML-Master 2.0的核心代碼開源,并通過SciMaster平臺逐步開放產(chǎn)品化能力。目前,該平臺已上線Waiting List申請通道,感興趣的研究者和工程團(tuán)隊(duì)可通過“SciMaster的朋友圈”提前體驗(yàn)。這一舉措不僅降低了AI科研工具的使用門檻,更為全球AI4Science社區(qū)提供了中國方案的參考。
從科幻作品中的“智子”到現(xiàn)實(shí)中的自主AI科學(xué)家,人類對智能體探索科學(xué)的想象正逐步成真。ML-Master 2.0的突破表明,通過將認(rèn)知過程視為可積累、可演化的資源,AI已具備在真實(shí)科研環(huán)境中長期成長的能力。在這場全球競逐中,中國團(tuán)隊(duì)正以開源大模型為基石,書寫屬于自己的篇章。





