在第二屆CCF中國數據大會上,螞蟻數科宣布了一項重要舉措:正式開源其數據智能體核心技術Agentar SQL的全套資料,涵蓋論文、代碼、模型以及詳細的使用指南。這一技術旨在讓非專業人士也能通過自然語言輕松完成商業數據的查詢與分析,為企業數字化轉型提供更加精準、實用的智能數據分析基礎。
作為首期開源內容,螞蟻數科推出了實時文本轉化結構化查詢語言(Text-to-SQL)框架,為開發者提供了一套即插即用的數據查詢解決方案,顯著提升了文本與數據庫查詢之間的交互效率。未來,該公司計劃在2026年陸續開源更多技術框架,包括數據庫理解與挖掘、行業知識挖掘以及實時多輪交互技術,覆蓋從意圖理解到業務理解再到數據理解的全鏈路數據能力。
由該技術支持的螞蟻數科數據分析智能體Agentar-Scale-SQL,已在全球權威的自然語言轉結構化查詢語言(NL2SQL)評測基準BIRD-SQL中脫穎而出,力壓Google等國內外知名企業,登頂排行榜。目前,該智能體在執行準確率和執行效率兩大榜單上均保持領先地位,持續領跑超過兩個月。BIRD-SQL評測要求AI模型將自然語言查詢精準轉換為SQL,并在真實復雜的大規模生產級數據庫中穩定運行。其數據集涵蓋金融、電力、醫療等37個行業場景,總量達33GB,包含超過1萬條高復雜度查詢任務,被公認為全球最具挑戰性的NL2SQL測試。
研究機構數據顯示,全球商業智能市場規模預計在2025年達到474.8億美元,而中國商業智能與分析軟件市場規模則有望達到12億美元。到2028年,中國商業智能軟件市場規模預計將增長至17.9億美元,未來五年年復合增長率(CAGR)為12.7%,成為企業智能技術投資的重要領域。
當前,中國企業在商業智能與分析產品的應用深度上存在較大差異,多數企業仍集中在數據可視化和簡單分析需求,如報表、駕駛艙、儀表板等。然而,如何在保證準確性的前提下,提升技術在真實生產環境中的可用性,仍是NL2SQL在產業中規模化落地的普遍難題。
螞蟻數科AI技術負責人章鵬在會上指出,NL2SQL在實際應用中面臨四大挑戰:理解人類口語的模糊多義性、注入龐大的行業專業知識、解析復雜的數據庫結構與關聯,以及生成準確無誤的復雜SQL語句。這些挑戰表明,簡單的模型“套殼”無法滿足企業級應用的可靠性與準確性要求。
以金融領域為例,從業者需要結合復雜業務規則與多條件組合進行數據查詢,以有效分析產品數據。而在業務管理中,非專業數據分析人員的口語化提問,則需要產品能夠準確理解行業術語和詢問意圖,并與數據庫字段精準匹配,才能生成真實準確的結果。
章鵬強調,BIRD-SQL主要評測SQL的復雜度生成能力(在線擴展OnlineScaling),但要實現產業可用的NL2SQL乃至數據智能體技術,必須構建更完整的能力棧。除了在線擴展,還需包括離線擴展(Offline Scaling),即對數據庫的深度理解與知識結構化;人機交互(Human Interaction),即智能體識別自身不確定性,主動與用戶澄清意圖,實現白盒化、可糾錯的協作;以及自我進化(Self Evolution),即通過“記憶”優化、工具(如UDF)創建與復用等“免調優”技術,使智能體能夠從錯誤中學習,持續提升,降低對大量標注數據和專家調優的依賴。
螞蟻數科計劃逐步開源這些更全面的能力模塊,如理解數據庫的Agentar Profiling-SQL、實現免調優進化的Agentar TuningFree-SQL等。目前,首期在線擴展框架Agentar-Scale-SQL的開源內容已發布在arXiv、GitHub、ModelScope及Hugging Face等平臺,供開發者免費使用。










