人工智能揭示了全球包装食品中隐藏的糖含量

快速阅读: 据《News-Medical.Net》称，研究开发了一种算法，通过机器学习预测全球包装食品的游离糖含量，评估碳水化合物质量。结果显示，植物基饮料符合较高标准，而巧克力味产品则不达标。该方法可优化营养评分系统并支持公共卫生政策制定。

恰坎塔·西德哈桑博士撰写
审校：舒莎·切里亚德斯，M.Sc.
2025年3月30日

一项开创性的算法揭示了食物中隐藏的糖分，并展示了哪些国家和产品符合健康碳水化合物的标准。

**研究：**
预测全球包装食品数据库中的碳水化合物品质。

图片来源：新非洲 / Shutterstock

碳水化合物是重要的能量供给源，在全球营养中发挥关键作用。尽管关于饮食的讨论通常集中在碳水化合物的数量，但碳水化合物的质量同样对维持良好健康至关重要。科学研究表明，碳水化合物的质量会影响代谢功能和慢性疾病的风险。

用于评估碳水化合物质量的一种工具是碳水化合物质量比（CQR），它要求每10克总碳水化合物至少含有1克膳食纤维，且每1克纤维的游离糖含量不得超过2克。这一比例有助于区分有益健康的食品与可能带来不良健康后果的食品。

然而，准确确定包装食品中的游离糖含量仍然是一个挑战。少数国家强制要求标明添加糖，这限制了消费者获取信息的透明度和研究人员获取数据的途径。根据世界卫生组织（WHO）的定义，游离糖包括添加糖以及蜂蜜、糖浆和果汁中的天然存在的糖分，而美国食品药品监督管理局（FDA）将添加糖定义为仅在加工过程中引入的糖分。这种信息缺乏阻碍了有效评估碳水化合物质量的努力，使得做出知情的饮食选择和研究碳水化合物消费对健康的影响变得困难。

**关于这项研究**

该算法优先考虑标签上列出的第一种成分，因为食品生产商通常按照成分重量排序列出配料，这为判断产品中糖分的主导地位提供了依据。

在这项研究中，研究人员开发了一种算法，用于预测全球包装食品中的游离糖含量，从而填补了碳水化合物质量方面的知识空白。他们使用了Mintel全球新产品数据库（GNPD）的数据，该数据库包含来自86个国家的包装食品的详细信息，包括营养成分和成分列表。

在分析之前，研究团队仔细清理和标准化数据以确保数据一致性。一个关键步骤是利用正则表达式手动整理和标记成分，将其分类为添加糖或天然存在的糖——这一区分对于准确估计游离糖含量至关重要。

为了构建预测模型，研究人员采用了机器学习技术。他们使用美国（U.S.）的数据训练模型，并在14个选定国家正式测试其性能，同时将模型应用于另外81个国家的产品。模型分析了产品标签，考虑了前六种被分类为添加糖、水果或乳制品的成分，以及详细的营养信息，如能量含量、脂肪、碳水化合物、纤维、蛋白质、糖和钠。

该流程包括三个二元分类器来检测添加糖的存在，并堆叠基于树的回归模型来估算其数量。此外，预测的添加糖值被用作游离糖的估计值，但在某些特定食品类别（如果汁饮料和糖果）中，直接使用总糖值，因为它们具有独特的糖分特征。

最后，模型应用于没有明确添加糖声明的产品，以预测其碳水化合物组成。碳水化合物质量通过预先定义的10:1到1:2的碳水化合物、纤维和游离糖比例进行评估。

**主要发现**

植物基奶替代品（如燕麦或杏仁饮料）意外地表现出对碳水化合物质量标准的高合规性，全球范围内优于许多乳制品基产品。

研究表明，机器学习模型在预测包装食品中的游离糖含量方面表现出高度准确性。测试集的平均绝对误差计算为0.96克/100克，表明预测值与声明值之间的平均差异相对较小。

此外，模型在预测值和声明值之间实现了0.98的高R²，优于先前的k-最近邻模型，后者显示出更高的错误率，这证明了预测结果的可靠性。值得注意的是，该模型的预测能力不仅限于美国。研究人员发现，当在14个国家正式测试时，模型表现准确，并且可以应用于另外81个国家，体现了其在全球范围内的适用性。

研究还考察了符合目标碳水化合物质量比的食品产品的比例，揭示了食品类别和国家之间存在显著差异。在美国，符合碳水化合物质量比的产品比例变化很大，从热谷物相对较高的60%到调味牛奶和麦芽饮料明显较低的0%，这一广泛范围凸显了即使在一个国家内部碳水化合物质量的多样性。

巧克力味产品（如谷物或零食棒）是表现最差的类别之一，由于游离糖含量过高和纤维含量过低，95%未能达到目标比例。

考虑到所有食品类别，达到目标比例的产品占比在英国为67%，表明对质量标准的遵守程度较高，而在马来西亚仅为9.8%，表明符合所需碳水化合物质量标准的产品比例显著下降。

值得注意的是，与其他饮料类别相比，植物基饮料在各国中对碳水化合物质量比表现出相对较高的遵守度，这是由于纤维含量较高且添加糖水平较低。

然而，研究人员承认，预测准确性可能因样本量较小而受到一定限制，这可能影响这些特定区域研究结果的普适性。

此外，作者在美国的18类食品中进行了z检验，比较预测和声明的游离糖值，未发现统计意义上的显著差异，这进一步证实了模型的稳健性。

**结论**

总之，这项研究成功开发并验证了一种基于机器学习的方法，用于预测全球数据库中包装食品中的游离糖含量。这种方法全自动且可扩展，在国家和食品类别中表现出强大的准确性，可以扩展到其他需要游离糖估计的数据库和营养指标。

预测的游离糖值还可以提升营养评分系统的效能，如Nutri-Score，目前该系统由于标签信息的局限性，依赖于总糖。

这种方法论上的创新提供了一个有价值的实用工具，用于监测和评估全球食品供应中的碳水化合物质量，为公共卫生政策制定和饮食指导提供了重要参考。

**引用文献：**
Scuccimarra, E. A., Arnaud, A., Tassy, M., Lê, K.-A., & Mainardi, F. (2025). 在全球包装食品数据库中预测碳水化合物质量。
《营养学前沿》，12。DOI:10.3389/fnut.2025.1530846
https://www.frontiersin.org/journals/nutrition/articles/10.3389/fnut.2025.1530846/full

(以上内容均由Ai生成)