谷歌推出DS STAR,多智能体系统自动转化商业问题为Python代码
快速阅读: 谷歌AI团队推出DS STAR,多智能体框架将商业问题转化为Python代码,无需人工分析师。系统处理多种数据格式,通过迭代规划、验证及调试模块,提升数据科学自动化水平。
谷歌 AI 研究团队近日推出 DS STAR(数据科学代理通过迭代规划和验证),这是一种多智能体框架,旨在将模糊的商业问题转化为可执行的 Python 代码,无需人工分析师介入。与传统数据科学代理依赖结构化的 SQL 数据库不同,DS STAR 能直接处理 CSV、JSON、Markdown 以及非结构化文本等混合格式的数据文件。
DS STAR 的工作流程分为几个阶段。首先,系统通过名为 Analyzer 的智能体对数据湖中的每个文件进行分析,生成 Python 脚本以提取关键信息,如列名、数据类型和元数据。这一步骤确保系统能获取每个文件的结构化视图,为后续分析提供上下文信息。
完成数据分析后,DS STAR 进入迭代规划和验证的循环。此过程涉及多个智能体,包括 Planner、Coder、Verifier 和 Router。Planner 负责创建初始的可执行步骤,Coder 将这些步骤转换为 Python 代码并执行,获得观察结果。Verifier 根据执行结果评估当前计划的有效性,必要时由 Router 决定如何修正计划。这一循环将持续进行,直至得出符合要求的结果或达到最大迭代次数。
此外,DS STAR 配备了 Debugger 和 Retriever 模块,以增强系统的鲁棒性。Debugger 在脚本失败时进行修复,确保系统即使在遇到模式漂移和缺失列的情况下也能正常运行。Retriever 负责从大量数据集中检索最相关的文件,为分析过程提供上下文支持。
经过一系列基准测试,DS STAR 在 DABStep、KramaBench 和 DA Code 等多项任务中展现出卓越性能,大幅提升了分析的准确性。这表明 DS STAR 能有效将复杂的数据科学问题转化为可靠的 Python 解决方案,推动了数据分析的自动化进程。
(以上内容均由Ai生成)