蚂蚁数科开源数据智能体技术
快速阅读: 记者从蚂蚁数科获悉,该公司在第二届CCF中国数据大会上开源数据智能体技术Agentar SQL,支持自然语言转SQL查询,已在某城商行试用中实现92%准确率,并在全球BIRD-SQL评测中超越谷歌等企业。
在近日举行的第二届CCF中国数据大会上,蚂蚁数科宣布开源其数据智能体技术Agentar SQL。该技术允许普通用户通过日常语言完成复杂的商业数据查询与分析,助力企业加速数字化转型。
此次开源的首个产品是一个实时文本转结构化查询语言(Text-to-SQL)框架,旨在帮助开发者快速构建高效的数据查询方案,显著提升自然语言与数据库之间的交互效率。未来,蚂蚁数科还将陆续推出数据库理解、行业知识挖掘及实时多轮交互等技术模块,进一步增强整体数据处理能力。
在某领先城市商业银行的试运营中,Agentar SQL的查询准确率超过92%,较传统方案提升逾三倍。该技术还在全球权威NL2SQL评测基准BIRD-SQL中表现突出,超越谷歌等国际企业,位居前列。BIRD-SQL涵盖金融、电力、医疗等37个真实场景,任务复杂、数据量大,被公认为最具挑战性的测试之一。
蚂蚁数科技术负责人章鹏指出,NL2SQL在实际应用中需应对口语模糊性、行业知识融合、复杂数据库解析及精准SQL生成等多重挑战,仅靠简单模型难以满足产业需求。他强调,要实现真正可用的数据智能体技术,必须构建一个包含数据库深度理解、人机高效交互与自我进化能力在内的完整体系。
目前,Agentar-Scale-SQL相关开源内容已在arXiv、GitHub等平台发布,引发开发者广泛关注。据研究机构预测,2025年全球商业智能市场规模将达到474.8亿美元,中国市场有望在2028年增至17.9亿美元,年复合增长率达12.7%。
(以上内容均由Ai生成)
引用自:AIbase人工智能资讯平台