“博士级”AI 是什么意思?OpenAI 传闻中的 20,000 美元代理计划解释道。
快速阅读: 据《Ars Technica》最新报道,开放AI计划推出多种专用AI产品,包括一个每月2万美元的“博士级别研究”层级。这些AI能执行需博士学位水平的专业任务,如高级研究和复杂数据分析。O3系列模型在多项基准测试中表现出色,显示其高水平的专业能力。开放AI声称,这些模型通过长时间推理计算,能更好地解决问题。
人工智能行业出现了一个新名词:“博士级别的AI”。根据《信息报》的一份报告,开放人工智能(简称开放AI)可能计划推出几种专门的AI“代理”产品,其中包括一个每月费用为2万美元的层级,专注于支持“博士级别的研究”。其他据称计划中的代理还包括一个面向高收入知识工作者的助手,每月费用为2000美元,以及一个面向软件开发者的代理,每月费用为1万美元。开放AI尚未确认这些价格,但他们之前曾提到过博士级别的AI功能。
那么,“博士级别的AI”到底指的是什么呢?该术语指的是那些能够执行需要博士学位水平专业知识的任务的模型。这包括代理进行高级研究、编写和调试复杂代码而无需人工介入,以及分析大量数据集以生成全面的报告。主要功能是这些模型可以解决通常需要多年专业学术训练才能处理的问题。像开放AI这样的公司基于特定基准测试中的表现来支持其“博士级别”声明。例如,开放AI的O1系列模型在科学、编码和数学测试中表现出色,在具有挑战性的任务上取得了与人类博士生相似的结果。该公司的“深度研究”工具,能够生成带有引用的研究论文,在涵盖超过3000个问题、涉及100多个科目的综合评估“人类最后的考试”中得分26.6%。
开放AI最新的进展来自他们于去年十二月宣布的O3和O3-mini模型。这些模型建立在去年早些时候推出的O1家族基础上。与O1一样,O3模型使用了开放AI所说的“私有链式思维”,这是一种模拟推理技术,模型通过内部对话并迭代地解决问题,然后提供最终答案。这种做法表面上反映了人类研究人员花费时间思考复杂问题而不是立即给出答案的方式。据开放AI称,在推理计算上投入的时间越长,得到的答案就越好。因此,关键点在于:对于2万美元,客户将获得大量的思考时间,让AI模型处理难题。根据开放AI的数据,O3在ARC-AGI视觉推理基准测试中获得了纪录性高分,在高计算测试中达到了87.5%,达到人类在85%阈值上的表现水平。该模型还在2024年美国邀请数学竞赛中获得了96.7%的成绩,仅答错一题,并在包含研究生水平生物学、物理学和化学问题的GPQA钻石测试中达到了87.7%。
(以上内容均由Ai生成)