IBM 首席执行官 Arvind Krishna 如何看待 AI 和量子
快速阅读: 据《时间》最新报道,IBM虽不再是人工智能领域的焦点,但仍致力于为企业构建高精度的小型模型。IBM认为,经济利益不仅归功于训练大型基础模型的公司,也属于能开发出高效、低成本专用模型的企业。IBM强调,未来的AI发展类似于互联网早期,既有利于大公司,也利于小企业。此外,IBM在量子计算方面持续投资,预计将在未来几年取得显著进展,从而巩固其市场地位。
毕磊 2025年3月2日,上午7:00 (点击此处订阅每周与全球顶尖CEO及决策者对话的邮件。)
IBM 是20世纪计算领域的巨头之一。它帮助设计了现代个人电脑,并创造了第一个在国际象棋比赛中战胜人类冠军的人工智能。然而,当谈到人工智能时,IBM 可能不是你首先想到的公司,甚至不是前十名。它不再训练大型模型,也不再生产面向消费者的成品,而是专注于向其他企业销售产品。“我们是一家B2B公司,向普通读者解释我们的业务——我们需要尽可能多的帮助。” IBM 首席执行官阿尔温德·克里希纳在最近接受《时代》杂志采访时开玩笑说。
尽管如此,在这个历史悠久的机构内部仍然隐藏着一个有趣的人工智能故事。IBM 确实构建了人工智能模型——不是像 OpenAI 的 GPT-4 或谷歌的 Gemini 那样庞大的模型,而是为高风险环境设计的小型模型,其中准确性至关重要。随着人工智能业务的发展,这触及了一个重要的问题:华尔街和硅谷投资者心中的问题——人工智能带来的经济收益是否会主要归功于那些训练大规模“基础模型”的公司,如 OpenAI?或者这些收益是否会流向那些能够构建最精简、最便宜且最准确的针对特定应用场景的模型的公司,如 IBM?
行业的未来可能取决于此。然而,当谈到人工智能时,IBM 可能不是你首先想到的公司,甚至不是前十名。它不再训练大型模型,也不再生产面向消费者的成品,而是专注于向其他企业销售产品。“我们是一家B2B公司,向普通读者解释我们的业务——我们需要尽可能多的帮助。” IBM 首席执行官阿尔温德·克里希纳在最近接受《时代》杂志采访时开玩笑说。
《时代》杂志在2月初采访了克里希纳,他在采访前获得了“时代100位AI影响力奖”。本次采访经过了压缩和编辑以提高清晰度。IBM 在1990年代建造了深蓝,第一个击败人类国际象棋冠军的人工智能。然后在2011年,IBM 的沃森成为第一个赢得电视智力竞赛《危险边缘》的系统。但如今,IBM 不像 OpenAI 或谷歌那样训练大型人工智能系统。你能解释一下为什么决定退居二线吗?
当你看国际象棋和《危险边缘》时,挑战的原因是对的。你选择一个人们认为计算机无法完成的任务,如果能完成,你就展示了技术的力量。这是我们走偏的地方:我们开始构建我称之为单一的大规模系统。我们开始说,让我们去解决癌症这样的问题。结果证明这是一个错误的方法。当然,解决它是值得的,所以我不会责怪当时的团队。然而,我们是否因为医疗实践而闻名?不。我们是否了解医院和协议如何运作?不。我们是否了解该领域的监管机制?不。回顾过去,我希望我们在一开始就能花几分钟时间考虑这个问题。
所以我们说,好吧,你可以生产越来越大的模型,它们将消耗越来越多的计算资源。所以选项一,投入十亿美元用于计算并生成一个模型。现在为了获得回报,你必须向人们收取一定的费用。但是我们能否将其提炼成一个更小的模型,可能不需要那么多计算资源,运行成本也更低,但适合商业环境中的任务?这就是业务视角的由来。但过去十年深度学习的一个核心结论似乎是,通过尝试使系统通用化而不是专门化,你可以从人工智能系统中获得更多。对吧?这就是所谓的“苦涩教训”。我可能会礼貌地不同意这一点。如果你愿意接受只有90%准确度的答案,也许可以。但如果我想控制一座高炉,它需要100%的准确性。这个模型最好内置一些时间序列分析的知识。这不是一个通用机器,它没有通过某种直觉来得出答案。所以,恕我直言,不。如果你真的想达到更高的准确性,你实际上可能会用一个小模型做得更好。
我相信会有几个非常大的模型。它们的训练成本可能高达数十亿美元,甚至更多。还会有成千上万个小模型,它们适用于特定用途。它们会利用大模型进行教学,但不会真正依赖其固有的知识。人工智能带来的主要经济利益是否会归功于那些训练基础模型的最大公司?还是那些将这些模型应用于特定用途的小公司?我认为这是一个“并且”。我认为人工智能的类比可能最接近互联网的早期阶段。所以在互联网上,问问自己,它只对非常大的公司有用,还是对非常小的公司也有用?
举两个相反的例子。如果我要建立一个视频流媒体业务,内容越多,服务的人就越多。你会得到网络效应,也会得到规模经济。另一方面,你有一个像Etsy这样的店面。突然间,一年只制作两件商品的手工艺人也能拥有展示平台,因为分发成本极低。你的回答如何影响了你的业务方向?
我们深入思考过。早在2020年,我们问自己:我们应该把所有的投资都投入到尝试建造一个非常大的模型吗?如果是很大的模型,运行这些模型的成本可以说是模型大小的平方。所以如果我有一个有100亿参数的模型和一个有1万亿参数的模型,运行那个非常大的模型将贵10000倍。然后你反过来问,如果它只比前者好1%,我真的愿意支付10000倍的费用吗?在商业世界中,这个答案几乎总是不。但如果它可以小10倍,嘿,那绝对值得,因为它将降低超过90%的运行成本。这就是我们做出决策的原因。
让我们谈谈量子计算。IBM 是量子计算的重要投资者。你对未来有什么更大的战略规划?
大约十年前,我们选择量子计算作为投资领域。我们得出结论,这更像是一个工程问题,而不是科学问题。一旦成为工程问题,你就需要解决两个基本问题:一是错误率很高,但普通计算机也是如此。人们没有意识到的是:有一些技术可以让它看起来没有错误。即使在我们使用的机器中,底层也有错误,但它们会自我纠正,所以我们看不到。二是由于量子计算本质上是在量子级别上运行,非常微小的能量变化会导致相干性损失。所以它们不能长时间工作。我们认为如果我们能达到接近毫秒的水平,就能进行非常精确的计算。因此,我们走了一条路,认为我们在错误校正方面取得了很大进展。目前相干时间约为十分之一毫秒,还未达到毫秒级。我们相信在未来三到五年内——我会给自己到本世纪末的时间——在这方面将发生一些惊人的事情,我对团队的进展感到非常满意。
如果你能在本世纪末实现你说的巨大突破,这对 IBM 的业务意味着什么?这是否会让 IBM 在下一轮技术浪潮中占据主导地位?
有硬件,还有所有将利用它的公司。让我先说清楚:利用这些技术的将是我们的所有客户。他们将获得价值,无论是材料发现、更好的电池、更好的肥料还是更好的药物,这些价值都将归功于我们的客户。但谁能给他们一台可用的量子计算机?我认为,假设我所说的进度和突破能够实现,这将使我们在市场上占据优势,并获得先发制人的机会,以至于我们认为我们将成为这些技术的默认答案。
技术一直是累积的。智能手机并没有取代笔记本电脑。我认为量子计算也将是累积的。就像我们曾经帮助发明了大型机一样,也许在量子计算领域,我们也会占据类似的位置相当长一段时间。
(以上内容均由Ai生成)