Agi 和 AI 超级智能需要回答的智能证明问题数量
快速阅读: 《福布斯》消息,专家指出,AGI与ASI的判定仍是重大议题,需设计全面测试方法。现有图灵测试已显不足,新测试如GPQA等正被采用。评估需兼顾技术、伦理与社会影响。
记者今日从AI领域专家处获悉,目前关于如何确定人工通用智能(AGI)和人工超级智能(ASI)是否实现,仍是一个悬而未决的重要议题。专家指出,这一问题不仅涉及技术层面,还有伦理和社会影响等多个方面。
为了探讨这一话题,专家们首先明确了AGI和ASI的基本概念。AGI指的是与人类智力相当的AI,能够在多个领域展现出与人类相似的智能水平;而ASI则是指超越人类智力的AI,能在几乎所有领域都表现出更高的智能。然而,人类距离实现AGI尚有一段距离,ASI更是遥不可及。
当前面临的一大挑战是如何有效测试AI是否达到了AGI或ASI的标准。现有的测试方法,如图灵测试,虽然著名但存在诸多争议。图灵测试由数学家艾伦·图灵于1949年提出,通过对话判断AI与人类的区别。然而,随着AI技术的发展,一些专家认为图灵测试已不再适用,甚至有人声称现有AI已经通过了图灵测试,但这并未得到广泛认可。
专家们认为,要确定AI是否达到了AGI或ASI,需要设计更加全面和系统的测试方法。例如,近期顶级AI公司推出的Grok 4等新模型,参与了多项专业测试,如HLE、ARC-AGI-2、GPQA等,这些测试涵盖了编程、数学、科学等多个领域。其中,GPQA测试包含了546个问题,涉及生物学、物理学和化学等领域的高难度题目,用于评估AI在这些领域的表现。
为了评估AGI,专家建议设计一个覆盖所有可能领域的综合测试。考虑到美国国会图书馆主题标题(LCSH)已有约40万条目,若每个领域设计100个问题,则需准备4000万道题。尽管这一数量看似庞大,但专家认为只有如此才能全面评估AI的智能水平。
专家强调,确定AGI的实现不仅是技术问题,更是社会和伦理问题。因此,制定合理的测试方法,确保评估过程的公正性和科学性,对于未来AI的发展至关重要。
(以上内容均由Ai生成)