Google 在其 Colab Python 平台上推出免费的 Gemini 驱动的数据科学代理
快速阅读: 《VentureBeat 公司》消息,谷歌近日推出了由Gemini 2.0模型驱动的数据科学代理,免费提供给18岁以上的用户。这款工具通过谷歌Colab简化数据分析,用户只需用自然语言描述目标,代理即可生成可执行的Jupyter笔记本。尽管功能强大,但其准确性仍有待提高。用户可通过谷歌Colab访问此工具,并获得样例数据集和提示。
加入我们的每日和每周通讯,获取行业领先的人工智能最新动态和独家内容。了解更多详情人工智能代理备受关注,但有没有专注于分析、整理并从大量数据中得出结论的代理工具呢?今天,谷歌宣布其数据科学代理——一个新的、免费的人工智能助手,由其模型Gemini 2.0驱动,用于自动化数据分析——现已向十八岁及以上用户提供免费服务,适用于选定国家和地区及语言。它通过谷歌Colab提供服务,这是该公司八年前推出的用于在其GPU和自家TPU上在线实时运行Python代码的服务。数据科学代理最初于2024年十二月为受信任的测试者推出,旨在帮助研究人员、数据科学家和开发人员通过生成完全可运行的Jupyter笔记本来简化工作流程,这些笔记本是基于自然语言描述的,所有这些都在用户的浏览器中完成。这一扩展与谷歌将AI驱动的编码和数据科学功能集成到Colab中的持续努力相一致,基于如Codey驱动的AI编码辅助等先前更新的基础上。它还作为一种高级且迟来的回应,针对OpenAI的ChatGPT高级数据分析功能,该功能现在已内置到ChatGPT中,当运行GPT-4时也是如此。
什么是谷歌Colab?
谷歌Colab(简称Colaboratory)是一个基于云的Jupyter笔记本环境,使用户可以直接在浏览器中编写和执行Python代码。Jupyter笔记本是一种开源的网络应用程序,使用户能够创建和共享包含实时代码、方程、可视化和叙述性文本的文档。起源于2014年的IPython项目,现在支持超过四十种编程语言,包括Python、R和Julia。这个交互式平台广泛应用于数据科学、研究和教育领域。自2017年推出以来,谷歌版本的谷歌Colab已成为机器学习、数据科学和教育领域中最广泛使用的平台之一。正如Spectralops.io的数据科学负责人奥里·阿布拉莫夫斯基在2023年一篇优秀的Medium文章中所详细描述的那样,Colab的低入门门槛和对GPU和TPU的免费访问使其成为许多开发者和研究人员的首选选项。他指出,低入门门槛、与Google Drive的无缝集成以及对TPU的支持使得他的团队能够在开发AI模型时大大缩短训练周期。然而,阿布拉莫夫斯基也指出了Colab的一些局限性,例如:- 会话时间限制(尤其是免费层级用户)- 高峰时段资源分配的不确定性- 缺乏关键功能,如高效的管道执行和高级调度- 支持方面存在挑战,因为谷歌提供的直接协助选项有限。尽管存在这些缺点,阿布拉莫夫斯基强调Colab仍然是可用的最佳无服务器笔记本解决方案之一——尤其是在机器学习和数据分析项目的早期阶段。
使用AI简化数据分析
数据科学代理通过消除手动设置的需求,在Colab的无服务器笔记本环境中构建。使用谷歌的Gemini AI,用户可以用简单的英语描述他们的分析目标(例如,“可视化趋势”,“训练预测模型”,或“清理缺失值”),代理将生成完全可执行的Colab笔记本作为响应。它提供以下功能:
– 自动化分析——生成完整的、可工作的笔记本而不是孤立的代码片段
– 节省时间——消除手动设置和重复编码
– 增强协作——利用Colab内置的共享功能进行团队项目
– 提供可修改的解决方案——用户可以调整和定制生成的代码
已经在加速现实世界的科学研究
根据谷歌的说法,早期测试者报告使用数据科学代理时节省了大量时间。劳伦斯伯克利国家实验室的一位科学家正在研究热带湿地甲烷排放问题,估计使用代理后,数据处理时间从一周缩短到了仅仅五分钟。该工具在行业基准测试中表现良好,在Hugging Face的DABStep:多步推理的数据代理基准测试中排名第四,领先于ReAct(GPT-4.0)、Deepseek、Claude 3.5 Haiku和Llama 3.3 70B等人工智能代理。然而,OpenAI的竞争对手o3-mini和o1模型,以及Anthropic的Claude 3.5 Sonnet都优于新的Gemini数据科学代理。
开始使用
用户可以通过以下步骤在谷歌Colab中开始使用数据科学代理:
1. 打开一个新的Colab笔记本。
2. 上传一个数据集(CSV、JSON等)。
3. 使用Gemini侧边栏以自然语言描述分析。
4. 执行生成的笔记本以查看见解和可视化。
谷歌提供了样本数据集和提示想法,帮助用户探索其功能,包括:
– Stack Overflow开发者调查——“可视化最受欢迎的编程语言”
– 虹膜物种数据集——“计算并可视化皮尔逊、斯皮尔曼和肯德尔相关系数”
– 玻璃分类数据集——“训练随机森林分类器”
每次用户想要使用新的数据科学代理时,他们需要导航到Colab并点击“文件”然后选择“在Drive中新建笔记本”,生成的笔记本将存储在他们的谷歌云端硬盘账户中。我自己的简短演示使用体验参差不齐
诚然,我只是一个卑微的技术记者,并不是数据科学家,但我在Colab中使用新版本的Gemini 2.0数据科学代理的经验并不完全顺畅。我上传了五个CSV文件(逗号分隔值,Excel或Sheets的标准电子表格文件)并询问它“我每个月和每个季度在公用事业上的花费是多少?”。代理继续进行了以下操作:
– 合并数据集,处理日期和账号编号不一致的问题
– 过滤并清理数据,确保只保留相关的支出
– 按月和季度分组交易以计算支出
– 生成可视化图表,如趋势分析的折线图
– 将发现总结成清晰、结构化的报告
在执行之前,Colab提示了一个确认消息,提醒我它可能会与外部API交互。它非常迅速而流畅地在浏览器中完成了这一切,仅用了几秒钟。看到它通过分析和编程逐步完成任务是非常令人印象深刻的。然而,最终生成的图表显示了一个月的公用事业支出,未能识别出表格包含了按月份划分的全年数据。当我要求它修订时,它尽了最大努力,但最终无法生成正确的代码字符串来回答我的提示。我尝试在一个新的Google Colab笔记本中从头开始使用相同的提示,结果生成了一个更好的,但仍然奇怪的结果。我将不得不进一步调试它,正如我说的,最初的错误结果可能是由于我自己缺乏使用数据科学工具的经验。
Colab定价和AI功能
虽然谷歌Colab仍然是免费的,但需要额外计算能力的用户可以升级到付费计划:
– Colab Pro(每月九点九九美元)——一百个计算单位,更快的GPU,更多内存,终端访问
– Colab Pro+(每月四十九点九九美元)——五百个计算单位,优先GPU升级,后台执行
– Colab企业版——谷歌云集成,AI驱动的代码生成
– 按需付费——一百个计算单位九点九九美元,五百个计算单位四十九点九九美元
除了数据科学代理,谷歌一直在Colab中扩展其AI功能。谷歌收集提示、生成的代码和用户反馈以改进其AI模型。虽然数据最多存储十八个月,但会被匿名化处理,删除请求可能不会总是得到满足。用户被建议不要提交敏感或个人信息,因为人类审查员可能会处理提示。此外,应仔细审查AI生成的代码,因为它可能包含不准确之处。
欢迎反馈
谷歌鼓励用户通过谷歌实验室Discord社区的#data-science-agent频道对数据科学代理提供反馈。随着AI驱动的自动化成为数据科学的关键趋势,谷歌的Colab数据科学代理可以帮助研究人员和开发人员更专注于洞察力而非编码设置。随着该工具扩展到更多的用户和地区,它将有趣地塑造AI辅助分析的未来发展。
每日商业案例洞察
如果您想给老板留下深刻印象,VB每日新闻将为您提供帮助。我们为您揭示公司如何使用生成式AI,从监管变化到实际部署,以便您分享见解以实现最大回报。立即订阅吧
阅读我们的隐私政策
感谢您的订阅
查看更多内容
VB新闻通讯
(以上内容均由Ai生成)