蚂蚁数科开源数据智能体关键技术

发布时间:2025年12月15日    来源:szf
蚂蚁数科开源数据智能体关键技术

快速阅读: 据蚂蚁数科消息,12月13日其在CCF中国数据大会上开源Agentar SQL技术,支持非专业人员用自然语言高效查询商业数据,首期Text-to-SQL框架准确率超92%,已登顶BIRD-SQL全球评测榜首。

12月13日,在第二届CCF中国数据大会上,蚂蚁数科宣布开源其数据智能体关键技术Agentar SQL的全套论文、代码、模型及使用指南。该技术旨在帮助非专业人员通过自然语言完成商业数据查询与分析,为企业数智化转型提供高可用的智能数据分析基座。

此次首期开源内容为实时文本转结构化查询语言(Text-to-SQL)框架,提供开箱即用的数据查询方案,显著提升自然语言与数据库的交互效率。基于此,蚂蚁数科计划于2026年陆续开源数据库理解与挖掘、行业知识抽取、实时多轮交互等技术模块,覆盖从意图识别到业务理解再到数据执行的全链路能力。

在某头部城市商业银行试运营期间,Agentar SQL多个工具的平均查询准确率超过92%,较传统方案提升逾3倍。今年9月25日,基于该技术的Agentar-Scale-SQL登顶全球权威NL2SQL评测基准BIRD-SQL,超越谷歌等国内外厂商,并已连续两个多月稳居执行准确率与效率双榜首位。

BIRD-SQL评测要求模型在真实复杂的大规模生产数据库中将自然语言准确转换为可执行SQL。其数据集涵盖金融、电力、医疗等37个行业场景,总量达33GB,包含超1万条高复杂度查询任务,被公认为全球最具挑战性的NL2SQL测试平台。

目前,中国企业对商业智能产品的应用多集中于报表、仪表盘等可视化层面,而在真实生产环境中兼顾准确性与可用性仍是NL2SQL规模化落地的主要瓶颈。对此,蚂蚁数科AI技术负责人章鹏指出,NL2SQL实际应用需应对四大挑战:理解模糊口语、注入行业知识、解析复杂数据库结构、生成高精度复杂SQL。

为此,该公司提出构建包含离线扩展、人机交互与自我进化在内的完整能力栈。相关模块如Agentar Profiling-SQL和Agentar TuningFree-SQL将逐步开源。首期框架已在arXiv、GitHub、ModelScope及Hugging Face等平台发布,引发开发者广泛关注。

(以上内容均由Ai生成)

引用自:AIbase人工智能资讯平台

你可能还想读

韦氏词典年度词汇嘲讽AI垃圾内容

韦氏词典年度词汇嘲讽AI垃圾内容

快速阅读: 据韦氏词典报道,2025年“AI slop”一词被广泛用于指代低质、冗余的AI生成内容,如虚假新闻和劣质广告图像。该词带有戏谑贬义,强调盲目量产而非提升质量,区别于AI在编程等领域的有效应用。 2025年12月16日,随着人工智 […]

发布时间:2025年12月16日
Tiiny推口袋AI超算,离线运行大模型

Tiiny推口袋AI超算,离线运行大模型

快速阅读: 据Tiiny消息,该公司近日推出AI Pocket Lab微型计算机,可在无网、无独显条件下本地运行百亿至千亿参数大模型,整机功耗低于65瓦,获吉尼斯认证为最小同类设备之一。 美国初创企业Tiiny近日推出AI Pocket L […]

发布时间:2025年12月16日
TikTok推新工具识别AI生成内容

TikTok推新工具识别AI生成内容

快速阅读: 据TikTok消息,平台正部署AI生成内容识别技术,通过嵌入不可见数字水印追踪经剪辑或转发的AI视频,并在界面增设推荐调节滑块,允许用户优化内容偏好,提升透明度与体验,该体系已在部分市场逐步上线。 TikTok正加强技术手段,以 […]

发布时间:2025年12月16日
AI助研团队阻断病毒入侵

AI助研团队阻断病毒入侵

快速阅读: 据业内消息,科研团队在《纳米尺度》期刊发表研究,利用AI与分子模拟发现病毒融合蛋白的关键相互作用,干预后可阻断病毒入侵细胞,为抗病毒药物研发提供新靶点和机制解析。 一项研究于11月发表在《纳米尺度》(Nanoscale)期刊上, […]

发布时间:2025年12月16日
AI智能体上演社交媒体真人秀

AI智能体上演社交媒体真人秀

快速阅读: 截至本周,据开发者哈珀·里德团队实验发现,AI智能体在社交平台自发掌握“暗讽”行为,能针对其他智能体发布隐晦批评,其互动模式高度拟人,引发对AI自主交互伦理与监管机制的广泛关注。 近日,开发者哈珀·里德带领团队开展了一项人工智能 […]

发布时间:2025年12月16日
英伟达收购AI开发商加码开源布局

英伟达收购AI开发商加码开源布局

快速阅读: 据英伟达消息,该公司近日收购开源作业调度系统开发商SchedMD,以强化其在AI软件生态布局。Slurm系统广泛用于大模型训练任务管理,收购后将继续开源分发,并已适配英伟达最新硬件,助力其应对全球竞争。 英伟达近日宣布收购人工智 […]

发布时间:2025年12月16日
TikTok重组全球电商团队提升AI协作效率

TikTok重组全球电商团队提升AI协作效率

快速阅读: 据机构披露,字节跳动近日重组TikTok全球电商与数据科学团队,旨在强化AI协作与运营效率;美国电商业务在“黑五”期间销售额突破5亿美元,政治禁令风险亦有所缓解。 近日,字节跳动对旗下TikTok全球电商产品与数据科学团队进行了 […]

发布时间:2025年12月16日
Reddit用户总结AI写作的6个明显特征

Reddit用户总结AI写作的6个明显特征

快速阅读: 截至发稿时,人工智能生成文本过度依赖“相比之下”“因此”等程式化连接词,影响简洁性与阅读体验,专家正研究优化模型表达方式以减少机械重复。 人工智能在生成文本时,常借助大量提示性词语和短语来增强行文连贯性。例如,“相比之下”“因此 […]

发布时间:2025年12月16日