Google Cloud 的 Vikas Mishra：“2025 年是 AI 代理的生产之年”

发布时间：2025年2月19日来源：szf

快速阅读: 据《印度分析杂志》称，在印度最大的开发者峰会MLDS 2025上，谷歌云的云架构师维卡斯·米什拉分享了在生产环境中部署人工智能代理的挑战。他强调了性能、成本、延迟和安全性等问题，并介绍了谷歌云的Vertex AI平台，该平台提供广泛的模型访问和工具，以解决这些挑战。米什拉还讨论了代理评估、实时信息锚定和安全治理的重要性。他表示Vertex AI能帮助AI代理从原型顺利过渡到生产阶段。

维卡斯·米什拉，谷歌云的云架构师，在印度最大的开发者峰会MLDS 2025上，分享了关于在生产环境中部署人工智能代理的复杂性的见解。米什拉表示，尽管大型语言模型（LLMs）的潜力已被广泛认可，但将其转化为实际应用仍然存在重大障碍。“2025年将是生产之年，”他预测道，并强调了从理论应用转向实施具体解决方案的压力日益增加。“你可以为内部和外部使用场景拥有多个代理——比如客户代理、员工代理、CX代理和代码代理，”他说。米什拉概述了阻碍成功部署LLM的关键挑战：性能、成本、延迟和安全性。他说，“实际上只有约50%的人在生产中运行它们”，尽管意图更高。他认为这种差距源于评估、调试以及确保代理持续功能的难度，特别是在复杂的多代理工作流中。提示或模型行为的微小变化可能影响用户体验，因此需要强大的评估和监控工具。

谷歌云Vertex AI来救援
米什拉强调选择正确平台的重要性。“这不在于模型，”他宣称，“而在于平台。”他还补充说，选择正确的平台可以解决客户问题的大约70%。他介绍了谷歌云的Vertex AI作为一个统一平台，解决了将AI代理投入生产的挑战。Vertex AI提供了广泛的模型访问，包括Gemini，并提供调优、托管和管理这些模型的工具。米什拉表示，谷歌云的Model Garden是一个用于构建、测试和部署模型的平台，托管了超过160个LLM，包括闭源和开源模型。“Llama、Claude和DeepSeek等模型都可以在Model Garden中找到，”他说。谈及谷歌的Gemini及其独特的功能，包括一个“200万上下文窗口”，使得处理大量信息成为可能，他展示了该模型的实时多模态演示，通过音频和视觉输入与其互动。

代理中的RAG
米什拉讨论了用实时信息锚定LLM的重要性。“你需要访问实时数据，”他表示，并指出Vertex AI允许与谷歌搜索和第三方数据源进行锚定。他还谈到了从提示设计到全面训练的模型调整过程，并介绍了各种代理开发工具，包括提供低代码和无代码选项的Agent Builder。米什拉强调，代理评估至关重要但困难重重。他描述了Vertex AI的在线评估服务，并介绍了用于AI基准测试的“Autorator”评估模型。他还强调了模型可观察性和追踪的重要性，指出使用Cloud Trace和Cloud Logging进行多代理工作流的调试。

最后，他谈到了安全和治理的关键方面。“你拥有你的数据，”他说，向与会者保证谷歌云不会使用客户数据来训练其模型。他还强调了安全过滤器和内容审核工具的重要性。他总结时重申，Vertex AI提供了一个全面的平台，将AI代理从原型带到生产阶段，利用谷歌云的基础设施和专业知识。

(以上内容均由Ai生成)