Agi 和 AI 超级智能需要回答的智能证明问题数量

发布时间：2025年7月20日来源：szf

快速阅读: 《福布斯》消息，专家指出，AGI与ASI的判定仍是重大议题，需设计全面测试方法。现有图灵测试已显不足，新测试如GPQA等正被采用。评估需兼顾技术、伦理与社会影响。

记者今日从AI领域专家处获悉，目前关于如何确定人工通用智能（AGI）和人工超级智能（ASI）是否实现，仍是一个悬而未决的重要议题。专家指出，这一问题不仅涉及技术层面，还有伦理和社会影响等多个方面。

为了探讨这一话题，专家们首先明确了AGI和ASI的基本概念。AGI指的是与人类智力相当的AI，能够在多个领域展现出与人类相似的智能水平；而ASI则是指超越人类智力的AI，能在几乎所有领域都表现出更高的智能。然而，人类距离实现AGI尚有一段距离，ASI更是遥不可及。

当前面临的一大挑战是如何有效测试AI是否达到了AGI或ASI的标准。现有的测试方法，如图灵测试，虽然著名但存在诸多争议。图灵测试由数学家艾伦·图灵于1949年提出，通过对话判断AI与人类的区别。然而，随着AI技术的发展，一些专家认为图灵测试已不再适用，甚至有人声称现有AI已经通过了图灵测试，但这并未得到广泛认可。

专家们认为，要确定AI是否达到了AGI或ASI，需要设计更加全面和系统的测试方法。例如，近期顶级AI公司推出的Grok 4等新模型，参与了多项专业测试，如HLE、ARC-AGI-2、GPQA等，这些测试涵盖了编程、数学、科学等多个领域。其中，GPQA测试包含了546个问题，涉及生物学、物理学和化学等领域的高难度题目，用于评估AI在这些领域的表现。

为了评估AGI，专家建议设计一个覆盖所有可能领域的综合测试。考虑到美国国会图书馆主题标题（LCSH）已有约40万条目，若每个领域设计100个问题，则需准备4000万道题。尽管这一数量看似庞大，但专家认为只有如此才能全面评估AI的智能水平。

专家强调，确定AGI的实现不仅是技术问题，更是社会和伦理问题。因此，制定合理的测试方法，确保评估过程的公正性和科学性，对于未来AI的发展至关重要。

(以上内容均由Ai生成)