研究发现,人工智能难以读取时钟和日历
快速阅读: 据《Knowridge 科学报告》最新报道,研究显示,顶级AI在读取时钟和理解日期方面表现不佳,准确率低且易出错。专家认为,解决这些基础问题对AI的实际应用至关重要。这项研究将在2025年ICLR会议上发表。
人工智能可以撰写文章、创作艺术,甚至进行对话,但在看时间或阅读日历时,它还有许多需要学习的内容。
爱丁堡大学的一项新研究发现,一些最先进的AI系统在读取时钟和理解日期方面存在困难,而这些任务大多数人都能轻松完成。人工智能可以撰写文章、创作艺术,甚至进行对话,但在看时间或阅读日历时,它还有许多需要学习的内容。
研究人员测试了能够处理文本和图像的多模态大型语言模型(MLLMs),以查看它们是否可以通过观察时钟和日历的图片来回答与时间相关的问题。结果显示令人惊讶:AI从时钟上获取正确时间的准确率低于25%,并且在回答日期相关问题时也常犯错误。
研究团队测试了不同设计的时钟,包括带有罗马数字、不同颜色表盘以及带秒针和不带秒针的时钟。尤其是当时钟指针风格化或采用罗马数字时,AI的表现更差。即便移除秒针也无法改善,这表明AI在检测和解析时钟指针这一基础任务上仍有不足。
当被问及与日历相关的问题时,AI模型约有五分之一的情况会出错。这些错误涵盖未能识别节假日、计算过去或未来日期以及解决简单日程安排等问题。问题不仅在于识别数字或形状——看时间与使用日历需要空间感知、语境理解及基础数学能力。
AI系统在某些推理类型上表现良好,但它们仍欠缺全面理解时间实际运作方式的能力。研究人员指出,修复这些弱点对于时间敏感型AI应用至关重要,例如日程助手、智能家居自动化、需要遵循基于时间指令的机器人以及为视障人士提供的工具。
这项研究结果将于2025年4月28日在新加坡的一个主要AI会议(国际学习表示会议,ICLR)上发表。首席研究员罗希特·萨克塞纳解释道:“大多数人从小就学会看时间和使用日历。我们的研究表明,AI在这些基本技能上仍然存在困难。若想让AI在日程安排、自动化或辅助技术领域发挥作用,这些问题就必须解决。”
团队中的另一位研究员阿里奥·格玛补充道:“AI研究主要集中于复杂推理,但讽刺的是,许多AI系统仍然无法处理日常生活中的简单任务。如果我们不弥补这些空白,AI可能在现实中依旧不可靠——在关键时刻止步不前。”
首席研究员罗希特·萨克塞纳解释道:“大多数人从小就学会看时间和使用日历。我们的研究表明,AI在这些基本技能上仍然存在困难。若想让AI在日程安排、自动化或辅助技术领域发挥作用,这些问题就必须解决。”
这项研究揭示了当下AI的一项令人意外的缺陷,并提醒我们有时看似简单的事情反而最难掌握。
(以上内容均由Ai生成)