Google Cloud 的 Vikas Mishra:“2025 年是 AI 代理的生产之年”
快速阅读: 据《印度分析杂志》称,在印度最大的开发者峰会MLDS 2025上,谷歌云的云架构师维卡斯·米什拉分享了在生产环境中部署人工智能代理的挑战。他强调了性能、成本、延迟和安全性等问题,并介绍了谷歌云的Vertex AI平台,该平台提供广泛的模型访问和工具,以解决这些挑战。米什拉还讨论了代理评估、实时信息锚定和安全治理的重要性。他表示Vertex AI能帮助AI代理从原型顺利过渡到生产阶段。
维卡斯·米什拉,谷歌云的云架构师,在印度最大的开发者峰会MLDS 2025上,分享了关于在生产环境中部署人工智能代理的复杂性的见解。米什拉表示,尽管大型语言模型(LLMs)的潜力已被广泛认可,但将其转化为实际应用仍然存在重大障碍。“2025年将是生产之年,”他预测道,并强调了从理论应用转向实施具体解决方案的压力日益增加。“你可以为内部和外部使用场景拥有多个代理——比如客户代理、员工代理、CX代理和代码代理,”他说。米什拉概述了阻碍成功部署LLM的关键挑战:性能、成本、延迟和安全性。他说,“实际上只有约50%的人在生产中运行它们”,尽管意图更高。他认为这种差距源于评估、调试以及确保代理持续功能的难度,特别是在复杂的多代理工作流中。提示或模型行为的微小变化可能影响用户体验,因此需要强大的评估和监控工具。
谷歌云Vertex AI来救援
米什拉强调选择正确平台的重要性。“这不在于模型,”他宣称,“而在于平台。”他还补充说,选择正确的平台可以解决客户问题的大约70%。他介绍了谷歌云的Vertex AI作为一个统一平台,解决了将AI代理投入生产的挑战。Vertex AI提供了广泛的模型访问,包括Gemini,并提供调优、托管和管理这些模型的工具。米什拉表示,谷歌云的Model Garden是一个用于构建、测试和部署模型的平台,托管了超过160个LLM,包括闭源和开源模型。“Llama、Claude和DeepSeek等模型都可以在Model Garden中找到,”他说。谈及谷歌的Gemini及其独特的功能,包括一个“200万上下文窗口”,使得处理大量信息成为可能,他展示了该模型的实时多模态演示,通过音频和视觉输入与其互动。
代理中的RAG
米什拉讨论了用实时信息锚定LLM的重要性。“你需要访问实时数据,”他表示,并指出Vertex AI允许与谷歌搜索和第三方数据源进行锚定。他还谈到了从提示设计到全面训练的模型调整过程,并介绍了各种代理开发工具,包括提供低代码和无代码选项的Agent Builder。米什拉强调,代理评估至关重要但困难重重。他描述了Vertex AI的在线评估服务,并介绍了用于AI基准测试的“Autorator”评估模型。他还强调了模型可观察性和追踪的重要性,指出使用Cloud Trace和Cloud Logging进行多代理工作流的调试。
最后,他谈到了安全和治理的关键方面。“你拥有你的数据,”他说,向与会者保证谷歌云不会使用客户数据来训练其模型。他还强调了安全过滤器和内容审核工具的重要性。他总结时重申,Vertex AI提供了一个全面的平台,将AI代理从原型带到生产阶段,利用谷歌云的基础设施和专业知识。
(以上内容均由Ai生成)