字節跳動旗下Seed團隊近日宣布,其研發的新一代形式化數學推理模型Seed Prover 1.5已正式亮相。這款模型通過大規模智能體強化學習技術訓練,在數學競賽題的自動化證明領域展現出顯著進步,尤其在處理復雜數學命題的嚴謹推導方面取得突破。
在嚴格的測試環境中,該模型在國際數學奧林匹克競賽(IMO)2025預選題的5道題目中,僅用16.5小時便生成了符合Lean證明系統標準的完整代碼,其得分表現達到該賽事歷史金牌分數線。另一項針對美國大學生數學競賽(Putnam)2025年賽題的測試顯示,模型在9小時內完成了12道題目中的11道可驗證證明,在Putnam歷史題庫中的整體解決率達到88%。這些數據表明,模型在限定場景下的數學推理能力已接近人類頂尖水平。
研發團隊特別指出,當前版本仍聚焦于"邊界明確、規則完備"的競賽類數學問題。對于需要跨領域知識整合、長邏輯鏈推導的前沿數學研究,模型尚無法完全替代人類專家的文獻分析能力和創造性思維。團隊同步公開了完整技術報告,并計劃在未來開放API接口,供全球數學研究者測試其在實際科研場景中的應用潛力。
據技術文檔披露,該模型通過構建多智能體協作框架,模擬數學家解題時的分工模式,在證明生成過程中自動分配定理驗證、反例排查等子任務。這種設計使其在處理組合數學、數論等結構化較強的領域時效率顯著提升,但在涉及幾何直觀或物理類比的問題上仍存在局限。






