下一个 Gemini Live 更新让 Google 的 AI 模型通过您的相机看到世界
快速阅读: 据《技术点》称,编者按:谷歌在MWC大会上展示了AI助手Gemini的新功能,包括实时视频分析和屏幕共享,旨在使其成为更互动的AI助手。这些功能被锁定在其每月收费20美元的高级计划中。尽管功能强大,但涉及隐私和数据安全的问题值得关注。谷歌计划本月晚些时候将这些更新推送到Android版Gemini应用,iOS版本随后跟进。
编者按:谷歌正努力将Gemini打造为更互动的AI助手,这可能会彻底改变我们使用这项技术的方式。然而,随着用户与Gemini分享他们的摄像头和屏幕,隐私问题又该如何处理?尽管实时辅助的好处显而易见,但数据滥用或过度获取的风险也是一个值得关注的问题。本周一,谷歌在巴塞罗那的全球移动通信大会(MWC)上亮相,展示了其AI助手Gemini的最新改进。该公司推出了两项新功能,使Gemini更加互动和情境感知,包括实时视频分析和屏幕共享功能。
Gemini Live的一项酷炫升级允许用户启动智能手机摄像头,将其对准物体、周围环境甚至电脑屏幕进行即时分析和反馈(上方)。无论是识别物品、解释技术问题还是帮助排除故障,谷歌希望Gemini不仅限于一个聊天机器人——它旨在成为一个能够实际看到正在发生事情的手动AI助手。第二项是一项新的屏幕共享功能,允许用户向Gemini Live展示他们的屏幕(下方)。然后,AI可以指导他们完成任务、提供特定应用的帮助或总结显示内容中的信息。
谷歌的目标是让数字协助感觉不像是一个聊天机器人,而是像一个始终在线的AI助手,能够实时解释和响应屏幕上的元素。然而,这些功能并非免费提供。谷歌将实时视频分析和屏幕共享锁定在其AI高级计划之后,该计划每月收费20美元。这一举措符合将先进AI能力置于付费墙后的行业趋势,如OpenAI的GPT-4.5通过ChatGPT Plus访问。还有一个问题:你有多信任将手机摄像头的访问权限交给谷歌?谷歌此前曾在去年为MWC 2024的参会者演示过这些功能(下方),当时它被称为项目Astra。通过摄像头,Gemini可以识别地标和物体,并记住演示者眼镜的位置。启用屏幕共享后,Gemini可以通过简单的摄像头扫描来协助购物或提供技术支持。虽然演示十分引人注目,但Ars Technica指出,当前AI在非理想条件下存在视频分析问题。然而,这次更新更为进化,早期反馈也相当积极,测试用户称赞了这种能够观察并回应其环境的AI助手的潜力。其他国家的用户很快就能亲自体验了。谷歌确认,这些更新将在本月晚些时候推送到Android版Gemini应用,iOS版本预计随后推出。
(以上内容均由Ai生成)