我喜欢 Microsoft 的 Copilot Vision 的潜力,但其他 AI 功能却不尽如人意
快速阅读: 《电脑世界》消息,在微软50岁生日派对上,展示了多个人工智能新功能。Copilot Vision和购物功能潜力大,但深度研究和个性化AI表现平平。整体而言,Copilot仍在早期阶段,未来发展值得关注。
在微软上周于雷德蒙德举办的50岁生日派对上,展示了众多全新的人工智能功能,我在活动中亲身体验了许多功能。其中,**Copilot Vision** 对消费者而言潜力最大,但其购物功能同样不可忽视。如果你对Copilot新增的记忆和个性特征感到担忧,我认为现在就下结论还为时过早——这些功能目前仍处于早期阶段。这是我参观微软50周年庆典并体验大部分新Copilot演示后的感受。
微软分享了关于一个能够与用户互动、帮助购物并逐步指导用户解决技术问题的个性化Copilot的愿景。最终,Copilot还将增加一些特定的研究工具,例如深度研究、AI生成的播客以及Copilot搜索。看到这些功能的实际演示,给我带来了不同的体会。我最感兴趣的三个功能是:**Copilot Vision**(用于Windows)、Copilot购物和Copilot搜索。至于其他功能,它们并未完全吸引我。
### Copilot Vision:巨大的潜力
微软提供了多种不同场景的选择来展示Copilot Vision的功能,这让我印象深刻,尤其是它在Photoshop中的导航表现十分出色。我选择了菜单上的游戏演示。遗憾的是,最终看到的还是之前提及的用Copilot Vision玩Minecraft的版本,而非像导航Blender CAD应用程序那样的全新内容。
当玩家在游戏中操作时,Copilot准确地识别出了绿宝石和皮革盔甲及其用途。照片中有一道奇怪的光线分割了画面。目前,Copilot Vision通过Copilot应用程序启动。它了解你正在查看的应用程序,但在你打开开关允许它访问之前不会主动解释结果。在这个演示中,Copilot Vision可以选择查看Minecraft或Clipchamp。我们选择了Minecraft。演示很短,Copilot Vision查看了箱子的内容,确定其中有盔甲和绿宝石,并解释了它们的用途。然后它查看了一些蔬菜并确定了它们是什么以及如何通过点击来收获它们。
微软员工随后打开了Clipchamp并询问如何在视频中实现过渡的问题,她用“让所有这些片段更无缝地融合”来形容。Copilot Vision将其理解为“寻求更平滑的过渡”。然后员工要求Copilot“突出显示”该怎么做。经过长时间的停顿后,Copilot Vision在正确的控制周围创建了一个光环或高亮。这里,Copilot识别出了屏幕上看到的“蔬菜”。
微软表示,Copilot Vision将在不久的将来作为Windows预览体验计划的一部分推出,大约一周左右。
—
### Copilot购物:潜力巨大
我对Copilot的购物能力感到比预期更加惊艳,只是因为微软最初的文档表明它将局限于特定的合作伙伴。ChatGPT两年前曾宣布这项能力,但似乎被推迟了。OpenAI在1月份重新宣布了这种代理能力,目前作为研究预览版推出。
Copilot的实现非常简单。你只需输入想要购买的东西,Copilot就会开始搜索。目前,Copilot的主要界面会向你展示它是如何工作的,包括各个主页和产品页面的快照,以及一个总结它要去哪里和正在做什么的侧边栏。购物功能看起来相当有趣。演示者要求从某个特定网站购买两打红玫瑰,Copilot开始搜索。然后她提出了一个更简单、更通用的要求,Copilot搜索了多个网站。(我的问题是,Copilot是否会优先选择微软的合作伙伴。)
购物设计为能够同时执行多项任务。想在给定日期预订纽约之旅吗?如果按预期运行,Copilot购物应该能够预订航班,了解谁将前往以及他们的偏好,为那些日期预订酒店,然后检查餐厅的座位情况,知道有多少人参加以及他们的偏好。Copilot浏览网页,查找优惠信息。
购物是微软试图赋予Copilot的“记忆”和个人化概念的一部分。它将很快推出。
—
### Copilot搜索:传统搜索的独特转折
Copilot搜索不是预览,而是现成可用的。值得一试。Anthropic使用了AI搜索;Google也曾这样做,但在后来撤回了。尽管我认为访问网页收集所需背景信息仍然值得花时间,但Copilot搜索确实有效。部分原因是它实际上“重写了”你的搜索以扩大焦点。例如,“Windows的最佳版本是什么?”可以被解释为“最可靠的Windows版本”或“功能最多的Windows版本”。(它的答案是Windows 7,这与我的排名有所不同。)看到AI实时取代我们的专业知识令人害怕。
有趣的是,微软并不认为Copilot搜索是一个Copilot功能,而是Bing的一部分。我不知道AI搜索能提供什么样的未来,但它是一种有趣的前进方式。
—
### 一些Copilot功能并不那么令人印象深刻
我对Google Gemini的深度研究印象深刻,它可以从几十个网页中提取信息并汇总其发现。Copilot的深度研究演示似乎没有那么深入。我没有清楚地了解到Copilot会从哪些来源获取信息,最终输出会有多少令牌和/或单词。让AI总结其发现很容易。让它呈现一篇长篇、有充分依据且连贯的文章更难——这是优质AI输出的一个标志。
“个性化AI”的整个概念也未能给人留下深刻印象。我被要求与Copilot讨论我的兴趣(以棒球投球为例)和其他相关信息。我被告知,微软理想情况下会利用这些信息构建我的喜好和厌恶的档案,也知道(例如)我有孩子或者我喜欢太平洋西北地区的访问是因为我喜欢凉爽的天气。但完全没有证据支持这一点,整个事情都依赖于我的想象力。
微软确实展示了一个由AI生成的“电子游戏”,每秒吐出几帧图像,间歇性地生成基于PC经典游戏《Quake》的第一人称射击关卡。为什么不把这视为微软展示的成功案例之一呢?因为除了概念之外,它真的很糟糕。如果你想的话,你可以自己试试。这只是《Quake》场景的杂乱拼凑,缺乏一致性和连贯性。你可能几秒钟内就会感到无聊。
AI可能会来到你的电脑上,但并不是所有东西都会成功。开发者们,你们的工作还没完。
—
**作者:马克·哈克曼,PCWorld高级编辑**
马克在过去十年里为PCWorld撰稿,拥有30年的技术报道经验。他独自为PCWorld撰写了超过3500篇文章,涵盖了PC微处理器、外围设备和微软Windows等多个主题。马克也为包括PC Magazine、Byte、eWEEK、Popular Science和Electronic Buyers’ News在内的出版物撰稿,在那里他因新闻报道获得了Jesse H. Neal奖。最近,他因为办公室已经没有更多空间而移交了一组几十个Thunderbolt扩展坞和USB-C集线器。
马克·哈克曼近期的文章:
– Windows Copilot立志成为你永远的好帮手,但你能相信它吗?
– Windows Copilot Vision能一步步帮你解决技术难题
– 微软50周年纪念的Windows壁纸其实很棒
(以上内容均由Ai生成)