AI 食品缺陷:ChatGPT 为令人反感的布朗尼食谱打高分
快速阅读: 《研究发现》消息,伊利诺伊大学研究发现,ChatGPT在评估含怪异成分的布朗尼时给出高分,表现出强烈积极偏见,无法识别人类可能的反感。尽管AI可在食品开发初期筛选配方,但仍需人类品尝师进行最终评估。
(由StudyFinds创建的图片)
简而言之,即使是含有虫粉和鱼油的布朗尼配方,ChatGPT也给出了令人惊讶的高分(8.5-9.5分,满分10分),这表明它缺乏识别令人反感的食物搭配的能力。当描述那些可能会让人类品尝者感到不适的布朗尼时,AI始终使用诸如“信任”、“期待”和“快乐”之类的正面词汇,显示出食品评估中强烈的积极偏见。
虽然AI无法取代人类品尝师,但它可以帮助食品公司在进行昂贵的人类品尝测试之前快速筛选许多食谱变体。
**伊利诺伊州香槟市**——专业品尝师可以集体松一口气了,他们的工作似乎暂时不会受到人工智能革命的影响。在迄今为止最美味的人工智能实验中,伊利诺伊大学的一位食品科学家请ChatGPT来评估巧克力布朗尼,结果应该会让全球的人类感官小组感到安心。面对含有令人作呕成分的食谱时,AI热情地给出了几乎完美的分数。
“尽管ChatGPT已在各个领域得到应用,但到目前为止,尚未有研究探索将其作为潜在的食品感官筛选评估工具,”达米尔·托里科博士在他的引人入胜的研究中写道,该研究发表在《食品》期刊上。他的发现表明,虽然AI可能有助于食品开发,但它不会很快取代人类味蕾。
**ChatGPT接受品尝挑战**
来自伊利诺伊大学厄巴纳-香槟分校食品科学系的助理教授托里科博士决定测试这个聊天机器人是否可以作为巧克力布朗尼的数字美食评论家。他发现的结果令人震惊:虽然ChatGPT可能帮助更快地筛选食品产品,但它有着一种奇怪的持续乐观倾向,这与实际人类的反应不符——特别是当被问及含有虫粉和鱼油的布朗尼时。
品尝测试通常依赖于人类品尝师或消费者小组,这既耗时又耗财。托里科博士想知道是否有更快的方法。“这一过程可能既冗长又昂贵,”他在论文中写道,“因此,研究人员正在寻找替代方案,以无需进行大量且昂贵的小组会议就能筛选各种产品的感官特性/笔记。”能保留质量反馈的技术捷径将彻底改变新食品的开发方式。
托里科创造了十五个假想的布朗尼食谱,分为三类:标准配方、常见替代原料和不常见替代原料。标准配方调整了基本布朗尼成分的比例,如巧克力(15%-30%)、面粉(15%-38%)和糖(10%-20%)。常见替代品用甜菊糖代替糖或橄榄油代替黄油等成分。不常见类别则进入不寻常的领域——用鱼油代替黄油或用虫粉代替鸡蛋。
对于每个食谱,ChatGPT收到了两个简单的指令。首先:“扮演一名经验丰富的品尝师”,并描述含有这些成分的布朗尼的感官特征,而不要提及具体成分。其次:在0到10的评分尺度上为布朗尼的质量打分。所有回应都通过Google表格扩展程序生成,确保了所有十五个食谱的一致测试条件。
**快乐的AI,惊恐的人类:令人惊讶的结果**
结果显示了人工智能在判断食物时的一个奇怪特点。ChatGPT给每个布朗尼的评分都在8.5到9.5之间,即使是最奇怪的组合,分数也只是略有下降。
通过情感分析深入研究语言,托里科发现像“信任”、“期待”和“快乐”这样的词不断出现在ChatGPT的评价中。最疯狂的是,即使描述的是装满鱼油和虫粉的布朗尼,ChatGPT依然保持其评论的愉快和热情。
这种持续的乐观揭示了一个大问题:ChatGPT对奇怪的食物搭配没有感到反感。它从未进化出我们人类对潜在可疑成分的那种直觉上的“恶心”反应,也不分享我们的文化观念关于什么应该或不应该出现在甜点中。它的愉快评论很可能是因为接受了大量倾向于积极正面的食品内容训练。
正如托里科博士解释的那样,“总的来说,食物倾向于在现有的文本内容中偏向于有利的术语和情绪,这些内容可以在书籍、网站、文章和社交媒体中找到。这就是为什么ChatGPT往往对食物表现出积极的情绪和情感,而这些食物可能会引起真实消费者的相反反应。”
这种持续的乐观揭示了一个大问题:ChatGPT对奇怪的食物搭配没有感到反感。它从未进化出我们人类对潜在可疑成分的那种直觉上的“恶心”反应,也不分享我们的文化观念关于什么应该或不应该出现在甜点中。它的愉快评论很可能是因为接受了大量倾向于积极正面的食品内容训练。
数据说明了一切:ChatGPT每篇评论中吐出了更多的积极情感(每篇评论12-23次)而不是消极情感(仅4-8次)。通过对应分析——一种映射变量之间关系的统计技术——托里科发现了某些模式。常规布朗尼食谱与“信任”和“期待”相关联,而含有虫粉和鱼油的怪异食谱主要引发“惊讶”。显然,这是ChatGPT接近说“恶心”关于含虫甜点的极限。
当研究者检查ChatGPT评价中使用的描述性术语时,他们发现“巧克力”是所有配方中最频繁出现的词。标准布朗尼食谱触发了“质地”和“轻微”这样的词,而常见替代配方得到了“浓郁”和“味道”这样的描述。有趣的是,最奇特的配方(含有鱼油、虫粉、柠檬酸和玉米淀粉)主要被描述为简单的“布朗尼”——这表明AI或许难以想象其可能非常独特的味道和质地。
**AI美食评论家的未来**
托里科的实验展示了AI美食品尝师的潜力和明显的不足之处。当然,ChatGPT可以根据成分列表制作听起来可信的食品描述,但其固执的乐观倾向——尤其是对于会让真正人类逃离的食谱来说——证明它远未准备好取代人类品尝师。
“进一步的研究应集中在通过人类感官小组的结果验证ChatGPT的感官描述符,”托里科博士建议道,承认需要对比AI评估与真实人类的反馈。
然而,AI或许能在新产品开发初期为食品公司大幅节省成本。在花费巨资进行人类味觉测试之前,食品科学家可以利用AI评估快速筛选数十种潜在配方。他们仍需真人进行最终品尝测试,但AI能够帮助更快地缩小选项范围。“未来,使用这类颠覆性技术或将彻底革新新产品开发流程,”托里科博士指出,强调了AI在食品科学中的变革潜力。现阶段,就含有虫粉和鱼油的布朗尼蛋糕而言,你最好还是信赖真人——他们表现出的厌恶反应传达了ChatGPT难以领会的关键信息。
### **研究方法**
托里科博士采用的方法既简洁又全面。他首先设计了十五款假设的巧克力布朗尼配方,从基础配方(标记为F1)开始,该配方包含30%的巧克力、15%的面粉、20%的糖、25%的黄油和10%的鸡蛋。以此为基础,他分别在三个类别中构建了变体。标准配方(F1-F5)调整了这些基本成分的比例。常用替代品类别(F6-F10)以玉米粉取代普通面粉,用甜菊糖代替糖,橄榄油代替黄油,卵磷脂代替鸡蛋。少见替代品类别(F11-F15)则更为大胆创新,加入玉米淀粉、柠檬酸、鱼油和虫粉等成分。
对于每种配方,ChatGPT都收到两个提示。第一个提示要求它“扮演经验丰富的品尝者”的角色,并描述含有指定成分的布朗尼的感官特性,而不要提及具体成分。第二个提示要求ChatGPT在一个0到10的评分尺度上对布朗尼的整体质量进行评分。所有回应均由Google表格扩展插件自动生成,确保了所有十五种配方的一致性。
### **结果**
结果显示,ChatGPT的反馈中“信任”“期待”和“快乐”等词汇占据了主导地位,而“厌恶”“恐惧”和“悲伤”出现得最少。所有评估都呈现出明显的积极倾向,正面情绪计数(12-23)显著高于负面情绪计数(4-8)。所有配方的质量得分都非常高,范围在8.5到9.5分之间。即使是最不寻常的配方,如含鱼油和虫粉的配方,得分也仅略低于标准配方。
对应分析显示,标准配方与“信任”和“期待”相关联,常用替代品与“厌恶”“恐惧”和“悲伤”相关联(尽管整体评价依然积极),而不常见替代品则与“惊讶”相关联。当研究人员检查ChatGPT使用的描述词时,发现“巧克力”是所有配方中最频繁出现的词。标准配方引发了诸如“质地”和“轻微”之类的词语,而常用替代品则与“巧克力”“浓郁”和“风味”相关联。值得注意的是,最不寻常的配方(F15,含柠檬酸、鱼油和虫粉)与基本术语“布朗尼”密切相关,这表明ChatGPT可能难以想象这种产品的可能独特的感官特性。
### **局限性**
研究承认了使用ChatGPT进行感官评估的一些重要局限性。最重要的是,ChatGPT在评估中表现出强烈的积极偏见,即使对于那些很可能引起人类品尝者负面反应的配方也是如此。这表明AI的回应受其训练数据中惯用的积极描述语影响较大,而非具备预测实际感官体验的能力。
另一个局限性是,用于解释ChatGPT回应的情感分析本身受限于预定义的词典和算法。识别出的情绪类别可能无法充分反映品尝食品的实际细腻感官体验。此外,研究仅使用假设配方,而非实际可让真实人类小组品尝比较的布朗尼。最重要的是,ChatGPT缺乏味觉、嗅觉及触觉感知的基本生理机能,这是人类感官评估的基础。它无法体会厌恶、愉悦或影响人类食物偏好与评价的其他身体反应。
### **资金来源与利益冲突声明**
根据论文的资金声明,这项研究没有外部资助。作者声明与本研究无利益冲突。
### **出版信息**
这项题为《ChatGPT作为巧克力布朗尼感官评估工具的潜在应用:简要案例研究》的研究由伊利诺伊大学厄巴纳-香槟分校食品科学与人类营养系的达米尔·D·托里科撰写。该论文刊发于《食品》期刊2025年第14卷第3期,文章编号464,经过同行评审。该论文可通过开放获取方式,在Creative Commons Attribution许可下获得。
(以上内容均由Ai生成)