AI 一夜之间成为主流的 10 个关键原因 – 以及接下来会发生什么

快速阅读: 据《ZDNet》称，ZDNET报道，生成式AI技术快速发展，尤其以ChatGPT为代表，已在2023年初对世界产生巨大影响。它经历了基础创新和市场力量推动两个阶段，涵盖了变换模型进步、广泛训练基础模型和硬件突破等内容。市场力量推动了AI的广泛应用，包括API访问、开源加速、消费者需求、病毒式传播等关键因素。这段技术革新不仅改变了工作流程，还加速了AI技术的普及。

ZDNET这项AI技术发展得真快，不是吗？简直就像是我们从坠毁的外星飞船上获得了先进的技术。我知道，我看了太多《星际之门》。但是，生成式AI的超高速“跨越鸿沟”的效应是真实的。生成式AI，借助像ChatGPT这样的工具，在2023年初对世界产生了巨大影响。突然之间，许多供应商开始在其产品中加入AI功能，我们的工作流程模式也发生了显著变化。还有：2025年最佳编程AI（以及不要使用的东西——包括DeepSeek R1）这一切是如何如此迅速地发生的，几乎一夜之间彻底改变了整个信息技术行业？是什么让它成为可能，并且为什么它进展得如此迅速？在这篇文章中，我将探讨十个关键因素，这些因素促成了生成式AI的迅猛发展及其在我们的技术栈和工作日实践中的采用。在我看来，像ChatGPT这样的AI工具的快速崛起及其广泛集成主要经历了两个阶段。让我们先从第一阶段开始。

第一阶段：基础创新

研究人员已经研究了数十年的人工智能。我在二十多年前的一个论文项目中研究过人工智能，上世纪90年代推出了AI产品，并且只要我在编程，就一直在与AI语言打交道。还有：2024年AI如何为我节省了工作时间——以及我计划在2025年如何使用它但尽管这些都是人工智能，它们的能力与ChatGPT相比是非常有限的。无论我在教育和职业生涯中多么深入地接触人工智能，我都对ChatGPT及其同类感到震惊。这是第一阶段。2020年代标志着一个基础性的人工智能创新时代，使人工智能从解决特定问题的能力扩展到能够处理几乎所有事情。这一阶段有三个关键因素。

1. 变换模型的进步

虽然人工智能已经被研究和使用了几十年，但在大部分时间里，它有一些根本性的限制。大多数AI需要预先用特定材料进行训练以形成专业能力。例如，在上世纪90年代初，我发布了一款基于专家系统的名为《家庭植物诊疗》的产品，该产品专门针对家庭植物疾病和治疗方法进行了训练。只要植物及其相关疾病在训练数据中，它就非常有用。任何超出这些数据的情况对于系统来说都是空白。还有：如何本地运行DeepSeek AI以保护您的隐私——两种简单方法AI还使用了一次只处理一个词的神经网络，这使得AI很难理解“河岸边的银行”和“市中心的银行”之间的区别。但在2017年，谷歌发表了一篇题为《注意力就是你所需要的全部》的论文。在论文中，他们提出了一种称为“自我注意”的模型，让AI可以专注于它们认为重要的词汇，从而使AI能够一次性处理整个句子和想法。这种“注意力机制的转变”使AI能够理解上下文（如句子中的“银行”是指河岸还是存钱的建筑物）。

2. 广泛训练的基础模型

变换模型的方法给研究人员提供了一种方式，可以在广泛的资料信息上训练AI并从信息本身确定上下文。这意味着AI可以扩展到几乎任何事物的训练，这使得像OpenAI的GPT-3.5和GPT-4这样的模型能够在几乎涵盖整个互联网和大量印刷书籍和材料的知识库中运作。还有：什么是稀疏性？DeepSeek AI的秘密，由苹果研究员揭示这使得它们几乎可以适应任何情况，并能利用大量的现实世界信息。这意味着AI可以用于几乎任何应用，而不是专门为解决个别问题而设计的应用。虽然我们花了数月时间训练《家庭植物诊疗》来处理植物数据，但ChatGPT、谷歌Gemini和微软Copilot都可以诊断家庭植物问题（以及其他很多东西），而无需专门训练。唯一的棘手问题是所有这些训练数据的所有权问题？目前有许多针对AI供应商因使用版权来源的数据进行训练和使用而提起的诉讼。这可能会限制大型语言模型可用的数据，并降低其实用性。使用这种无限规模训练数据的另一个问题是，其中许多信息未经验证。我知道这对你们所有人来说都是个意外，但互联网上发布的许多信息并不总是准确、适当或理智的。供应商正在努力加强护栏，但我们人类甚至不确定什么是适当的。只需问问两个持有截然不同观点的人什么是真相，你就会明白我的意思。

3. 硬件突破（GPU和TPU）

到2020年代初，一些公司和研究团队开发了基于变换模型和全球规模训练数据集的软件系统。但所有那些句子范围的转换计算都需要巨大的计算能力。还有：AI数据中心正变得“令人难以置信的大”不仅需要能够高速执行大规模并行和矩阵运算，还需要在保持功率和冷却成本处于大致实用水平的同时做到这一点。早期发现，NVIDIA的游戏GPU具备AI所需的矩阵运算能力（游戏渲染也是高度基于矩阵的）。但随后，NVIDIA开发了其Ampere和Hopper系列芯片，大幅提高了性能和功耗利用率。同样，谷歌开发了自己的TPU（张量处理单元），专门设计用于处理AI工作流。微软和亚马逊也开发了自定义芯片（Maia和Graviton），以帮助它们构建自己的AI数据中心。这些巨大的AI芯片驱动的数据中心带来了三个重大影响：全球规模的训练变得可负担，至少对最大的参与者而言是这样。AI能力可以通过SaaS模式进行计量和销售，使AI对大多数企业都可及。AI处理速度迅速提高，使得实时和近实时的数据分析成为可能（这对于自动驾驶汽车来说已被证明是至关重要的）。

第二阶段：市场力量推动采用

好吧，现在我们有了成熟的技术。那又怎样呢？我是说，有多少次工程团队推出了一项他们认为革命性的产品或功能，结果却因为缺乏实用性或市场接受度而夭折？但现在，有了生成式AI，正是市场力量推动了真正的变革。让我们深入探讨七个更重要的关键因素。

4. ChatGPT面向所有人，以及API访问

然后出现了ChatGPT。它的名字很有趣，我们大多数人花了一段时间才熟悉它。ChatGPT字面上意味着一个生成式的聊天程序，预训练并且使用变换技术。尽管这个名字只有极客才会喜欢，但在2023年初，ChatGPT成为了史上增长最快的APP。OpenAI免费向所有人开放了ChatGPT。当然，免费版有一些使用限制。它也和谷歌搜索一样容易（或者更容易）使用。你所要做的就是打开网站并输入你的提示。就是这样。由于我们之前讨论过的三项创新，ChatGPT的回答质量令人惊叹。每个尝试的人都突然意识到自己触及了未来。还有：ChatGPT Plus或Pro是否值得？这里是如何与免费版比较的然后，OpenAI通过API向其他程序员开放了ChatGPT模型。任何一个程序员只需要一个周末的学习时间和一张信用卡号就可以将改变世界的AI添加到任何应用程序中。每次API调用的成本并不比其他商业API高多少，这使得AI成为一个非常引人注目且易于集成的功能，可以帮助公司扩展其产品线，增加一个超级热门的新收入生产服务。进入壁垒？什么进入壁垒？

5. 开源加速

虽然像OpenAI提供的供应商支持API可以大大缩短上市时间，但它们也可能导致供应商锁定。为了防止完全依赖专有技术，开源社区大力拥抱了AI。开源模型（LLaMa、Stable Diffusion、Falcon、Bloom、T5等）提供了非专有的、自托管的AI能力，而不依赖于大型科技垄断。开源还通过允许开发者在大模型提供商必须维持的限制之外创建AI解决方案，实现了AI的民主化。还有：最好的开源AI模型：解释所有您可免费使用的选项来自Hugging Face等平台的工具提供了易于使用和测试的工具，使不同技能水平的开发者能够快速将AI集成到他们的项目中。当然，还有开源的经典优势：大规模协作、持续改进、社区生成和验证的优化，以及新功能的引入，包括一些对大厂商来说不具盈利性但对于某些项目却是必要的功能。所有这些都为各种规模的企业、研究人员，甚至是夜班和周末开发者提供了机会，让他们可以将AI添加到他们的项目中，这反过来又加速了AI在广泛应用中的采用。

6. 消费者和企业需求

事实上，生成式AI不仅仅是炒作。它确实有效并且提供了价值。除了写作方面的帮助（这违反了ZDNET的政策），我记录了2024年AI在15种不同方式上帮助了我的具体实例。还有：根据Anthropic的数据，人们最常使用Claude AI完成的工作任务这些用途范围从编程和调试帮助到修复照片，再到进行上述的情感分析，再到制作专辑封面，再到为我妻子的电子商务商店生成每月图片，再到在视频剪辑中创建移动遮罩，再到清理不良音频，再到拍摄时跟踪我，再到进行项目研究，等等。我并不是唯一一个注意到这一点的人。无论是小型企业还是大型企业，学生还是个人贡献者，他们都注意到了生成式AI确实能提供帮助。不仅AI公司的估值飙升，消费者实际购买并广泛使用了这些突然出现的AI工具。

7. 病毒式传播和网络效应

多年来，几十年来，AI一直远离主流。当然，视频游戏中有一些有限的AI。为一些公司构建了专家系统来解决特定问题。有很多前景和研究。但当谈到“给我看钱”时，从未有过风险投资家及其同类要求的技术投资的压倒性回报。还有：从零到百万？普通人如何靠AI赚钱然后，突然间，玛格姨妈在家庭聚会上提起了ChatGPT。AI成为了一件事，它是惊人的，哦天哪，它能做到的事情。你知道你可以让它说话像海盗吗？你知道你可以让它写一篇《星际迷航》的故事吗？你知道它可以分析你的孤立业务数据并在几分钟内给你情感分析而不需要任何编程吗？而且你知道它可以写出有用的代码吗？在短短几个月内，ChatGPT成为了史上增长最快的APP，用户数量达到了1亿。一年后，用户数量翻倍至2亿。

8. 竞争市场压力

这又能值多少呢？

9. 立法和监管滞后

这场新的AI热潮具有狂野西部的特征。政府们只是试图理解这一切是什么，以及这是否是一个巨大的经济机遇或存在生存威胁。提示：两者都是。美国政府制定了一些关于AI监督的计划，但这些计划最多也只能说是敷衍了事。AI供应商警告如果没有监管，可能会发生灾难。关于版权问题的诉讼使情况变得更加复杂。然后，新政府改变了游戏规则，重点关注大幅减少监管。所有这些都为AI公司和使用AI的企业创新并引入新功能打开了大门。这对于快速增长和创新非常有利，但也意味着技术在没有护栏的情况下运行。这无疑推动了AI技术的普及，但也可能非常糟糕。

10. 持续的创新和投资

因此，我们进入了讨论的循环阶段。AI不会消失。所有的自我实现预言都在推动新的创新，因为它们确实有效。大型公司不仅继续对这项技术下注数十亿美元，还提供能够为客户提供真正价值的引人注目的产品和服务。越来越多的公司和个人正在投资于AI初创企业和持续服务。我们看到了像多模态AI（文本/图像/视频/音频）、自主代理，甚至用AI来编写AI等突破。因此，我们进入了讨论的循环阶段。AI不会消失。所有的自我实现预言都在推动新的创新，因为它们确实有效。大型公司不仅继续对这项技术下注数十亿美元，还提供能够为客户提供真正价值的引人注目的产品和服务。另外：什么是Perplexity Deep Research，如何使用它？

我所能想到的最接近这种良性循环的例子是2000年代中期的应用程序经济。数据速度变得足够快且足够便宜，使得手机可以始终连接到互联网，初创企业提供了被证明是有实际价值的应用程序服务，这些公司变得庞大并继续提供服务，越来越多的投资进入移动优先计算领域，为消费者和生产者带来了回报。很可能一个良性循环也在驱动AI的创新和生产，将生成式AI和其他基于AI的服务推向主流，使其不太可能消失。

(以上内容均由Ai生成)