下一个 Gemini Live 更新让 Google 的 AI 模型通过您的相机看到世界

发布时间：2025年3月4日来源：szf

快速阅读: 据《技术点》称，编者按：谷歌在MWC大会上展示了AI助手Gemini的新功能，包括实时视频分析和屏幕共享，旨在使其成为更互动的AI助手。这些功能被锁定在其每月收费20美元的高级计划中。尽管功能强大，但涉及隐私和数据安全的问题值得关注。谷歌计划本月晚些时候将这些更新推送到Android版Gemini应用，iOS版本随后跟进。

编者按：谷歌正努力将Gemini打造为更互动的AI助手，这可能会彻底改变我们使用这项技术的方式。然而，随着用户与Gemini分享他们的摄像头和屏幕，隐私问题又该如何处理？尽管实时辅助的好处显而易见，但数据滥用或过度获取的风险也是一个值得关注的问题。本周一，谷歌在巴塞罗那的全球移动通信大会（MWC）上亮相，展示了其AI助手Gemini的最新改进。该公司推出了两项新功能，使Gemini更加互动和情境感知，包括实时视频分析和屏幕共享功能。

Gemini Live的一项酷炫升级允许用户启动智能手机摄像头，将其对准物体、周围环境甚至电脑屏幕进行即时分析和反馈（上方）。无论是识别物品、解释技术问题还是帮助排除故障，谷歌希望Gemini不仅限于一个聊天机器人——它旨在成为一个能够实际看到正在发生事情的手动AI助手。第二项是一项新的屏幕共享功能，允许用户向Gemini Live展示他们的屏幕（下方）。然后，AI可以指导他们完成任务、提供特定应用的帮助或总结显示内容中的信息。

谷歌的目标是让数字协助感觉不像是一个聊天机器人，而是像一个始终在线的AI助手，能够实时解释和响应屏幕上的元素。然而，这些功能并非免费提供。谷歌将实时视频分析和屏幕共享锁定在其AI高级计划之后，该计划每月收费20美元。这一举措符合将先进AI能力置于付费墙后的行业趋势，如OpenAI的GPT-4.5通过ChatGPT Plus访问。还有一个问题：你有多信任将手机摄像头的访问权限交给谷歌？谷歌此前曾在去年为MWC 2024的参会者演示过这些功能（下方），当时它被称为项目Astra。通过摄像头，Gemini可以识别地标和物体，并记住演示者眼镜的位置。启用屏幕共享后，Gemini可以通过简单的摄像头扫描来协助购物或提供技术支持。虽然演示十分引人注目，但Ars Technica指出，当前AI在非理想条件下存在视频分析问题。然而，这次更新更为进化，早期反馈也相当积极，测试用户称赞了这种能够观察并回应其环境的AI助手的潜力。其他国家的用户很快就能亲自体验了。谷歌确认，这些更新将在本月晚些时候推送到Android版Gemini应用，iOS版本预计随后推出。

(以上内容均由Ai生成)