南派資訊:12月13日,第二屆CCF中國數(shù)據(jù)大會上,螞蟻數(shù)科宣布開源旗下數(shù)據(jù)智能體關(guān)鍵技術(shù)Agentar SQL全套論文、代碼、模型和使用指南。該智能體技術(shù)可讓非專業(yè)人員通過日常語言進行商業(yè)數(shù)據(jù)查詢和分析,為企業(yè)數(shù)智化提供更精準(zhǔn)可用的智能數(shù)據(jù)分析基座。
![]()
螞蟻數(shù)科首期開源實時文本轉(zhuǎn)化結(jié)構(gòu)化查詢語言(Text-to-SQL)框架,為開發(fā)者提供一套開箱即用的數(shù)據(jù)查詢方案,提升文本與數(shù)據(jù)庫查詢交互效率。2026年,螞蟻數(shù)科將陸續(xù)開源數(shù)據(jù)庫理解與挖掘、行業(yè)知識挖掘、實時多輪交互技術(shù)框架,覆蓋意圖理解、業(yè)務(wù)理解到數(shù)據(jù)理解的全鏈路數(shù)據(jù)能力。
記者了解到,在某頭部城商行試運營期間,螞蟻數(shù)科Agentar SQL多個工具的平均查詢準(zhǔn)確率超92%,較傳統(tǒng)查詢方案提升超3倍。
今年9月25日,由該技術(shù)支持的螞蟻數(shù)科數(shù)據(jù)分析智能體Agentar-Scale-SQL登頂全球最具權(quán)威性的自然語言轉(zhuǎn)結(jié)構(gòu)化查詢語言(NL2SQL)評測基準(zhǔn)BIRD-SQL,超越Google等諸多國內(nèi)外廠商。目前,該智能體仍在執(zhí)行準(zhǔn)確率排行榜以及執(zhí)行效率榜保持雙榜第一,已持續(xù)領(lǐng)跑超兩月。
![]()
BIRD-SQL要求AI模型將自然語言查詢轉(zhuǎn)換為SQL,并且在真實復(fù)雜的大規(guī)模生產(chǎn)級數(shù)據(jù)庫中穩(wěn)定執(zhí)行。其數(shù)據(jù)集覆蓋金融、電力、醫(yī)療等37個真實行業(yè)場景,總量33GB,包含超過1萬條高復(fù)雜度查詢?nèi)蝿?wù),被認(rèn)為是全球最難的NL2SQL測試。
研究機構(gòu)預(yù)測,全球商業(yè)智能市場規(guī)模2025年達(dá)474.8億。中國商業(yè)智能與分析軟件市場規(guī)模2025年達(dá)12億。預(yù)計到2028年,中國商業(yè)智能軟件市場規(guī)模將達(dá)到17.9億美元,未來5年市場年復(fù)合增長率(CAGR)為12.7%,成為未來構(gòu)建企業(yè)智能技術(shù)的重要且必要的投資領(lǐng)域。
目前,中國企業(yè)對商業(yè)智能與分析產(chǎn)品的使用深度差異較大,大部分集中在報表、駕駛艙、儀表板、數(shù)據(jù)大屏等數(shù)據(jù)可視化和簡單分析需求。而如何在保持準(zhǔn)確性的前提下,提升在真實生產(chǎn)環(huán)境中的可用性被認(rèn)為是NL2SQL在產(chǎn)業(yè)中規(guī)模化落地的普遍挑戰(zhàn)。
螞蟻數(shù)科AI技術(shù)負(fù)責(zé)人章鵬在會上指出,NL2SQL在實際落地中面臨四大嚴(yán)峻挑戰(zhàn):理解模糊多義的人類口語、注入龐大的行業(yè)專業(yè)知識、解析復(fù)雜的數(shù)據(jù)庫結(jié)構(gòu)與關(guān)聯(lián),以及生成準(zhǔn)確無誤的復(fù)雜SQL語句。這些挑戰(zhàn)意味著,簡單的模型“套殼”遠(yuǎn)不足以滿足企業(yè)級應(yīng)用的可靠性與準(zhǔn)確性要求。
例如金融領(lǐng)域從業(yè)者往往需要結(jié)合復(fù)雜業(yè)務(wù)規(guī)則與多條件組合進行數(shù)據(jù)查詢才能有效地進行產(chǎn)品數(shù)據(jù)分析;業(yè)務(wù)管理中,非專業(yè)數(shù)據(jù)分析人員口語化提問,則需要背后的產(chǎn)品保證行業(yè)術(shù)語、詢問意圖的正確理解,再與數(shù)據(jù)庫字段精準(zhǔn)匹配,才能產(chǎn)出真實準(zhǔn)確的結(jié)果。
章鵬強調(diào),BIRD-SQL主要評測SQL的復(fù)雜度生成能力(在線擴展Online Scaling),但要真正實現(xiàn)產(chǎn)業(yè)可用的NL2SQL乃至數(shù)據(jù)智能體技術(shù),必須構(gòu)建更完整的能力棧。除了在線擴展,還需包含:
1. 離線擴展(Offline Scaling):對數(shù)據(jù)庫的深度理解與知識結(jié)構(gòu)化。
2. 人機交互(Human Interaction):智能體識別自身不確定性,主動與用戶澄清意圖,實現(xiàn)白盒化、可糾錯的協(xié)作。
3. 自我進化(Self Evolution):通過“記憶”優(yōu)化、工具(如UDF)創(chuàng)建與復(fù)用等“免調(diào)優(yōu)”技術(shù),使智能體能夠從錯誤中學(xué)習(xí),持續(xù)提升,降低對大量標(biāo)注數(shù)據(jù)和專家調(diào)優(yōu)的依賴。
螞蟻數(shù)科計劃逐步將這些更全面的能力模塊持續(xù)開源,如理解數(shù)據(jù)庫的Agentar Profiling-SQL、實現(xiàn)免調(diào)優(yōu)進化的Agentar TuningFree-SQL等。首期在線擴展框架Agentar-Scale-SQL開源內(nèi)容已發(fā)布在arXiv、GitHub、ModelScope及Hugging Face等平臺,并迅速獲得了開發(fā)者的關(guān)注。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.