12月15日消息,在第二屆CCF中國數(shù)據(jù)大會(huì)上,螞蟻數(shù)科宣布開源旗下數(shù)據(jù)智能體關(guān)鍵技術(shù)Agentar SQL全套論文、代碼、模型和使用指南。該智能體技術(shù)可讓非專業(yè)人員通過日常語言進(jìn)行商業(yè)數(shù)據(jù)查詢和分析,為企業(yè)數(shù)智化提供更精準(zhǔn)可用的智能數(shù)據(jù)分析基座。
螞蟻數(shù)科首期開源實(shí)時(shí)文本轉(zhuǎn)化結(jié)構(gòu)化查詢語言(Text-to-SQL)框架,為開發(fā)者提供一套開箱即用的數(shù)據(jù)查詢方案,提升文本與數(shù)據(jù)庫查詢交互效率。2026年,螞蟻數(shù)科將陸續(xù)開源數(shù)據(jù)庫理解與挖掘、行業(yè)知識(shí)挖掘、實(shí)時(shí)多輪交互技術(shù)框架,覆蓋意圖理解、業(yè)務(wù)理解到數(shù)據(jù)理解的全鏈路數(shù)據(jù)能力。
今年9月25日,由該技術(shù)支持的螞蟻數(shù)科數(shù)據(jù)分析智能體Agentar-Scale-SQL登頂全球最具權(quán)威性的自然語言轉(zhuǎn)結(jié)構(gòu)化查詢語言(NL2SQL)評(píng)測基準(zhǔn)BIRD-SQL,超越Google等諸多國內(nèi)外廠商。目前,該智能體仍在執(zhí)行準(zhǔn)確率排行榜以及執(zhí)行效率榜保持雙榜第一,已持續(xù)領(lǐng)跑超兩月。 BIRD-SQL要求AI模型將自然語言查詢轉(zhuǎn)換為SQL,并且在真實(shí)復(fù)雜的大規(guī)模生產(chǎn)級(jí)數(shù)據(jù)庫中穩(wěn)定執(zhí)行。其數(shù)據(jù)集覆蓋金融、電力、醫(yī)療等37個(gè)真實(shí)行業(yè)場景,總量33GB,包含超過1萬條高復(fù)雜度查詢?nèi)蝿?wù),被認(rèn)為是全球最難的NL2SQL測試。
研究機(jī)構(gòu)預(yù)測,全球商業(yè)智能市場規(guī)模2025年達(dá)474.8億。中國商業(yè)智能與分析軟件市場規(guī)模2025年達(dá)12億。預(yù)計(jì)到2028年,中國商業(yè)智能軟件市場規(guī)模將達(dá)到17.9億美元,未來5年市場年復(fù)合增長率(CAGR)為12.7%,成為未來構(gòu)建企業(yè)智能技術(shù)的重要且必要的投資領(lǐng)域。
目前,中國企業(yè)對(duì)商業(yè)智能與分析產(chǎn)品的使用深度差異較大,大部分集中在報(bào)表、駕駛艙、儀表板、數(shù)據(jù)大屏等數(shù)據(jù)可視化和簡單分析需求。而如何在保持準(zhǔn)確性的前提下,提升在真實(shí)生產(chǎn)環(huán)境中的可用性被認(rèn)為是NL2SQL在產(chǎn)業(yè)中規(guī)模化落地的普遍挑戰(zhàn)。
螞蟻數(shù)科AI技術(shù)負(fù)責(zé)人章鵬在會(huì)上指出,NL2SQL在實(shí)際落地中面臨四大嚴(yán)峻挑戰(zhàn):理解模糊多義的人類口語、注入龐大的行業(yè)專業(yè)知識(shí)、解析復(fù)雜的數(shù)據(jù)庫結(jié)構(gòu)與關(guān)聯(lián),以及生成準(zhǔn)確無誤的復(fù)雜SQL語句。這些挑戰(zhàn)意味著,簡單的模型“套殼”遠(yuǎn)不足以滿足企業(yè)級(jí)應(yīng)用的可靠性與準(zhǔn)確性要求。
例如金融領(lǐng)域從業(yè)者往往需要結(jié)合復(fù)雜業(yè)務(wù)規(guī)則與多條件組合進(jìn)行數(shù)據(jù)查詢才能有效地進(jìn)行產(chǎn)品數(shù)據(jù)分析;業(yè)務(wù)管理中,非專業(yè)數(shù)據(jù)分析人員口語化提問,則需要背后的產(chǎn)品保證行業(yè)術(shù)語、詢問意圖的正確理解,再與數(shù)據(jù)庫字段精準(zhǔn)匹配,才能產(chǎn)出真實(shí)準(zhǔn)確的結(jié)果。
章鵬強(qiáng)調(diào),BIRD-SQL主要評(píng)測SQL的復(fù)雜度生成能力(在線擴(kuò)展OnlineScaling),但要真正實(shí)現(xiàn)產(chǎn)業(yè)可用的NL2SQL乃至數(shù)據(jù)智能體技術(shù),必須構(gòu)建更完整的能力棧。除了在線擴(kuò)展,還需包含:1. 離線擴(kuò)展(Offline Scaling):對(duì)數(shù)據(jù)庫的深度理解與知識(shí)結(jié)構(gòu)化。?2. 人機(jī)交互(Human Interaction):智能體識(shí)別自身不確定性,主動(dòng)與用戶澄清意圖,實(shí)現(xiàn)白盒化、可糾錯(cuò)的協(xié)作。?3. 自我進(jìn)化(Self Evolution):通過“記憶”優(yōu)化、工具(如UDF)創(chuàng)建與復(fù)用等“免調(diào)優(yōu)”技術(shù),使智能體能夠從錯(cuò)誤中學(xué)習(xí),持續(xù)提升,降低對(duì)大量標(biāo)注數(shù)據(jù)和專家調(diào)優(yōu)的依賴。
螞蟻數(shù)科計(jì)劃逐步將這些更全面的能力模塊持續(xù)開源,如理解數(shù)據(jù)庫的Agentar Profiling-SQL、實(shí)現(xiàn)免調(diào)優(yōu)進(jìn)化的Agentar TuningFree-SQL等。首期在線擴(kuò)展框架Agentar-Scale-SQL開源內(nèi)容已發(fā)布在arXiv、GitHub、ModelScope及Hugging Face等平臺(tái)。











