Google 刚刚在 Colab 上为数据科学家发布了一个新的 AI 代理,它可以免费使用
快速阅读: 据《ITProPortal》称,谷歌实验室已将其数据科学代理向所有谷歌Collab用户开放,该工具能将数据分析时间从数周缩短至几分钟。借助Gemini 2.0的支持,用户可用自然语言描述所需分析,系统则会生成完整的可执行Collab笔记本。该代理通过大型语言模型分解和规划任务,涵盖数据清洗、探索及绘图等子流程。未来,谷歌计划增加交互元素,提升自然语言理解能力,并支持更多复杂任务和算法。
—
谷歌实验室已将数据科学代理向所有谷歌Collab用户开放,旨在帮助自动化数据分析流程。借助Gemini 2.0的支持,用户可用自然语言描述所需分析,系统则会生成完整的可执行Collab笔记本。该代理通过大型语言模型分解和规划任务,涵盖数据清洗、探索及绘图等子流程。未来,谷歌计划增加交互元素,提升自然语言理解能力,并支持更多复杂任务和算法。
(图片来源:盖蒂图片社)谷歌实验室已将数据科学代理向所有谷歌Collab用户开放,旨在帮助自动化数据分析流程。谷歌Collab是一个免费的云端托管Jupyter笔记本,用户可以在此编写和执行Python代码。据这家科技巨头称,数据科学代理可以帮助用户将研究和数据分析时间从数周缩短至几分钟,因为无需进行诸如导入库、加载数据和编写样板代码等设置任务。该公司表示:“实际上,一位劳伦斯伯克利国家实验室的科学家在进行全球热带湿地甲烷排放项目的研究时估计,谷歌的数据科学代理将他们的分析和处理时间从一周缩短到了五分钟。”
由Gemini 2.0提供支持,数据科学代理用户可以用自然语言描述他们想要看到的分析。随后,在一个可工作的Collab笔记本中自动生成所需的代码、导入库和分析。谷歌表示,数据科学代理提供了功能齐全的Collab笔记本,而不仅仅是代码片段,而是完整的、可执行的笔记本。解决方案可以修改,生成的代码可以定制和扩展。我们从值得信赖的测试者那里听到了一些很棒的反馈,比如“数据科学代理生成了简洁且高质量的代码,有效纠正了错误,并证明了其易用性”,以及“我已经开始探索数据科学代理,并认为这是一款很棒的产品。这种访问将极大地帮助我简化我的数据工作流程并揭示有价值的信息”。
谷歌数据科学代理的工作原理揭秘
数据科学代理通过编排一个复合流程来工作,该流程模仿典型数据科学家的工作流程,使用大型语言模型(LLM)进行任务分解和规划。流程由专门从事具体数据科学任务(如数据清洗、数据探索和数据绘图)的独立原子流程或子流程组成。数据科学代理通过编排一个复合流程来工作,该流程模仿典型数据科学家的工作流程,使用大型语言模型(LLM)进行任务分解和规划。每个原子流程是一系列单独的步骤,利用代码执行和执行输出反馈来完成子任务并与下游通信。结合自然语言转代码、LLM的规划和推理能力以及代码执行,允许代理能力如自我改进、错误修正和总结,谷歌表示。
笔记本由人工智能动态生成,包括生成的代码、代码输出(例如图表)和文本单元格。通过在任务描述中使用自然语言指定库、可视化类型、算法或评估指标,可以对其进行定制。用户还可以生成处理缺失值、异常值、不一致性和格式问题的代码,并创建可视化和汇总统计信息以理解数据的分布、关系和特征。同样,他们可以进行假设检验、相关性分析和其他统计技术,从而从数据中得出有意义的见解。同时,预测建模允许基于您的数据和目标构建和评估回归或分类任务的机器学习模型。谷歌表示,未来数据科学代理的计划包括在笔记本生成过程中增加交互元素以供用户反馈和定制,以及增强自然语言理解以实现更灵活的输入描述。此外,它还计划支持更多复杂任务的附加数据类型,以及更广泛支持的数据科学任务和算法,并提供更大的文件上传支持。
更多来自ITPro的内容
关于OpenAI的“运营商”代理你需要知道的一切
Workday希望让管理AI代理变得更加容易
GitHub的新“代理模式”功能让AI接管开发者的控制权
艾玛·伍拉科特社交链接导航
艾玛·伍拉科特是一名自由撰稿人,为包括BBC、《私人眼》、福布斯、Raconteur和专业科技出版物在内的媒体撰写文章。
(以上内容均由Ai生成)