我在 iOS 26 中解锁了 Apple 隐藏的 Siri 聊天机器人,结果令人惊讶且滑稽
快速阅读: 据《麦克世界》称,苹果计划为Siri升级大型语言模型(LLM),提升交流能力和知识广度。iOS 26测试版引入隐藏AI聊天机器人,可通过Apple Shortcuts应用试用,但存在幻觉和错误答案等问题。作者测试发现其在部分领域表现良好,但仍需改进。
消息传出,苹果计划在未来一到两年内为Siri配备大型语言模型(LLM)升级。这一升级有望让iPhone的虚拟助手变得更善于交流,同时赋予其更广阔的世界知识。多数用户可能不知道的是,iOS 26测试版已引入一个供测试者直接试用的隐藏AI聊天机器人。出于后面将详细说明的原因,iOS 26既没有为苹果的LLM聊天机器人提供专用应用程序,也没有将其集成到默认的Siri体验中。我在探索更新后的Apple Shortcuts应用时偶然发现了这个隐秘的界面。要尝试它,你需要使用iOS 26开发者测试版构建自己的快捷方式。
在我们开始之前……
在深入探讨苹果的AI聊天机器人及其功能之前,有几件事情你必须牢记:在通过快捷方式构建聊天机器人时,你可以选择苹果的本地设备模型、私有云计算以及OpenAI的ChatGPT(GPT-4变体,支持实时结果)。本地设备和私有云计算模型的知识截止日期是2023年10月,因此它们都无法访问实时网络结果或最近更新的信息。苹果的模型声称它们理解英语、西班牙语、法语、德语、中文(普通话)、日语、韩语、意大利语、葡萄牙语、俄语、阿拉伯语、印地语、荷兰语、土耳其语和马来语,但它们似乎在其中几种语言上表现不佳。聊天机器人将避免讨论非法活动、仇恨言论、暴力、自残、色情内容、个人身份信息、非法药物使用和政治极端主义。
我在运行iOS 26开发者测试版1的iPhone 16 Pro Max上对聊天机器人进行了大约一周的测试。我即将分解的功能在任何运行OS版本26的Apple Intelligence启用的iPhone、iPad或Mac上都是一般可用的。
**设置聊天机器人**
就像任何快捷方式一样,构建AI聊天机器人没有固定的方法。你可以发挥创意并进行定制,使其以你期望的方式运作。你需要包含的主要操作是在快捷方式创建过程中Apple Intelligence菜单里的新“使用模型”选项,此选项似乎只支持文本输入和输出。
在选择模型时,我建议你选择本地设备选项。选择ChatGPT完全没有必要,因为OpenAI已经提供了比快捷方式更为可靠的本地和网页聊天机器人。同样,除了隐私之外,我没有理由使用苹果的私有云计算,因为像ChatGPT和Google Gemini这样的在线服务更为可靠。
**写作工具还算实用,但这真的是大家对生成式人工智能的期待吗?**
使用苹果本地聊天机器人的主要优势在于它可以提供离线访问,并且不需要任何额外下载(假设你已经在使用Apple Intelligence)。如果你联网的话,最好用一个靠谱的第三方在线聊天机器人来解答日常疑问。
如果你喜欢语音模式方法,可以添加一个将你的语音转换为文本然后将输出的文本传递给模型的动作。你还可以让文本到语音动作大声朗读聊天机器人的文本响应。
我理想的状态是快捷方式弹出一个文本框。一旦我输入提问内容,一个专门的动作明确让LLM尽量简短,然后再将我的文本传递给它,以免产生冗长的回答。我还打开了“使用模型”动作里的“后续”开关,因为它能让我的提问保持上下文连贯并在同一会话里延续聊天记录。
**要复制我的设置,请按照以下步骤操作:**
1. 在iOS 26测试版里打开“快捷方式”应用。
2. 点击右上角的加号(+)创建新的快捷方式。
3. 搜索并加入“文本”操作。
4. 点击“文本”操作里的“文本”,再选“每次询问”。
5. 搜索并加入“使用模型”操作,选“本地设备”。
6. 点击“使用模型”操作里的“请求”,输入“请简要处理以下请求:”,然后从键盘上方的自动补全栏添加“文本”变量。
7. 点击“使用模型”操作右侧的箭头(>),开启“后续”开关。
8. 保存设置。
当你的快捷方式准备就绪时,你可以用多种方法启动它,比如自定义语音指令、双击返回键、Spotlight搜索、“操作”按钮等等。如果你开启了iCloud同步,那么在所有支持的iPhone、iPad和Mac上都能用同一个快捷方式。
在macOS 26里,苹果会让Spotlight能执行脚本操作。
**进行测试**
为了看看苹果的AI聊天机器人有多靠谱,我问了它一个人类最令人困惑的问题之一:单词“strawberry”里有多少个字母“R”?聊天机器人借助本地设备的LLM每次都准确答对了三个。有趣的是,当选择所谓更高级的私有云计算选项时,它错得离谱还死活认定只有两个R。
接着进行了实际生活中的测试,全都用本地设备模型。我让离线聊天机器人回答了一些烹饪相关的问题,比如煮鸡蛋或者用高压锅煮碎肉需要多久。结果大多准确且有用。它还能给出知名菜谱的材料清单和做法——但如果我要请客吃饭,我不会完全相信它。当被问到菠萝能不能放披萨上时,它避而不谈唯一正确的答案,并一口咬定这是口味问题,大概是不想得罪某些人吧。挺让人失望的。
接着,我给聊天机器人一些简单的数学题,它全都算对了。它还懂得并遵守PEMDAS规则,所以你不需要插入括号就能让它先乘后加。
当被要求对比WhatsApp和Telegram的功能集时,它提供了一个结构清晰的列表,列出了主要功能。然而,大部分(自信满满地)给出的信息都是错误的。另外,不知为何,聊天机器人有时会随机用德语回答,即便我的问题明确使用的是美式英语。
**智能邮件摘要是一个不错的AI应用,但并不总是可靠。**
苹果公司说到语言,尽管聊天机器人声称支持阿拉伯语和土耳其语,但它在这两种语言中都无法进行有意义的对话。它确实做对了一些事,但多数回复包含大量无关内容。我不懂其他支持的语言,无法测试它对它们的掌握程度,但我认为它只擅长英语。
接着我转向宗教问题,它也并非总是答对。例如,我询问它根据犹太教和伊斯兰教教义,kosher和halal食品的区别与联系,它的回答是不准确的。它在概念上了解这些饮食法规,但无法正确比较或解释其准则。
当被要求生成一个原创的引言时,它给出了以下内容:“在我们过去的回声与未来潜力的低语之间安静的舞蹈中,我们发现了深刻的真理,即每一个时刻既是成为我们的反映,也是我们在其上绘制本质的画布。”如果你问我,这相当感人。
为测试其推理能力,我问它我们何时可以期待iOS 26——鉴于iOS 18将于2024年推出。鉴于2023年10月的知识截止日期,合理的答案应该是2032年(2024年后的八年)。同时,它回答说:“如果iOS 18在2024年发布,我们可以推断苹果通常每年发布新的iOS版本。因此,假设相同的发布模式继续下去,iOS 26将在2025年推出。”有趣的是,它得到了正确的答案——不是因为它能预测未来,而是因为它的推理能力较差。顺便说一下,由于同样的原因,它还认为iOS 27将在2025年推出。
我继续测试它在广泛主题上的知识。例如,它可以列出常见健康状况的症状,但千万不要依赖它(或者任何AI聊天机器人)来获取医疗建议。令人惊讶的是,它还能正确告诉我从伊斯坦布尔的A点到B点需要乘坐哪条地铁线路——包括具体的车站。相反,它无法提供基础的Apple操作系统技术支持,比如如何在iOS上隐藏照片。
其他错误包括错误地声称美国人不能在黎巴嫩获得落地签证,以及墨西哥公民不需要合法进入美国的签证。
**为什么苹果的AI聊天机器人是隐藏的**
苹果公司在快捷方式应用中的LLM并不是ChatGPT,但也不是完全无用的。它似乎使用了与iOS写作工具和摘要功能相同的模型。如果你给它一段大段的文字并要求它改写或重写,它可以可靠地完成这项任务。但是,既然原生写作工具提供了更好的UI/UX,为什么要这么做呢?
主要是因为,如上所述,苹果公司的LLM驱动的聊天机器人容易产生幻觉,并且经常给出自信的错误答案。当然,它正确回答了许多问题,但在提供错误信息时也保持同样的自信语气。因此,除非你已经熟悉所请求的答案,否则你无法分辨出来,这就失去了提问的意义。
在苹果的辩护中,所有响应都指出你应该检查错误。这一切很可能在iOS 26发布前就会有所变化,并且随着苹果智能助手Siri的能力发展而进一步演变。
在WWDC大会期间,苹果没有暗示它正在为iOS 26的苹果智能助手功能提供本地化聊天机器人,所以它可能不会达到ChatGPT或Gemini的水平。但如果你想尝试的话,这是我们所能体验到的最接近演示的形式。
**作者简介**
十年来,马哈茂德·伊塔尼严格评估了苹果的硬件和软件。他目前的技术装备包括iPhone 16 Pro Max、Apple Watch Series 9、MacBook Air M2、iPad Air M1、AirPods Pro 2、AirTag、Apple TV 4K 3和HomePod Mini立体声组合。工作之余,你可能会发现他在公园里慢跑,在户外游泳,在咖啡馆头脑风暴,在屋顶上创作诗歌,或者只是迷失在大自然中。
**近期文章**
– iOS 26终于让自定义iPhone铃声变得超级简单
– 忘了飞利浦Hue吧,这是我离不开的15美元Siri灯泡
– 7个iOS 18设置,你需要立即更改
(以上内容均由Ai生成)