DeepSeek 和开源模型如何撼动 AI

快速阅读: 据《BNN 彭博社》称，科技公司和学术界长期探讨开源软件的利弊，近期生成式AI热潮加剧了这一讨论。中国初创公司深寻发布开源模型，宣称性能媲美美国顶级开发者，引发关注。开源软件虽降低成本、促进创新，但也存在安全隐患。深寻采用“开放”策略，但未提供详细训练数据。政府认为目前不宜限制开源AI，但仍需警惕潜在风险。

科技公司和学术界长期以来一直在探讨构建开源软件的风险与回报。然而，围绕生成式人工智能的热潮为这一讨论增添了新的重要性。中国人工智能初创公司深寻（深寻）的崛起更是引起了对这一问题的关注。深寻最近发布了一个开源模型，声称其性能可与美国顶级人工智能开发者的软件相匹敌，并且声称仅用较少的开发成本和较弱的硬件就达到了这一水平。以下是您需要了解的内容：

**什么是开源？**
通常来说，开源指的是源代码可以自由使用或修改的软件。根据加利福尼亚州的非营利组织开源促进会（OSI），为了符合开源标准，软件必须遵守特定的分发和访问条款。为了被视为真正的开源，开发者必须提供详细的训练数据信息，并允许人们出于任何目的研究、使用和修改该系统。

**相比之下，封闭源代码**
指的是由开发者控制的软件和模型，不能被修改，且对其技术基础提供的透明度较低。

**顶级AI开发商是否提供开源软件？**
许多科技公司将其AI软件标榜为开源；但并非所有人都认为它们完全符合这一定义。顶级AI开发商是否提供开源软件？Meta平台公司、法国初创公司Mistral以及现在的深寻都发布了他们称之为开源的AI模型。（尽管名字中有“开放”，OpenAI并未开源其大部分模型。）但这些模型往往实际上是所谓的开放权重模型。这意味着除了提供模型及其部分源代码外，公司还会披露权重——即模型在训练过程中获取并调整的许多数值，这使得开发者能够更好地定制模型，但不提供实际用于训练的数据细节。例如，Meta提供了其Llama系列AI模型的权重和部分源代码，但未提供详细的训练数据信息。Meta也曾因包含某些商业用途限制的许可条款而受到OSI的批评。同样，在今年1月，深寻表示已将其最新系统R1作为开源模型发布，但它没有提供代码或训练数据。这引发了关于该公司可能使用了什么来构建其模型的具体疑问。

**开源的好处是什么？**
那些推广开源软件的人通常认为它对用户来说更经济实惠，因为它没有相同的许可证费用。更低的价格促进了更广泛的AI应用，减少了开发成本促进了创新。支持者还指出，这种方法通过让其他人更好地理解模型的工作原理，增强了开发者创建强大AI系统的责任。封闭系统存在风险，可能导致少数几家公司主导AI市场。云存储公司Box的首席执行官亚伦·莱维曾说：“在非常昂贵且专有的AI世界中，AI供应商可以选择保留所有经济利益——基本上排挤了开发者和生态系统的机遇。”

对于像Meta这样的公司来说，开源还有一个额外的好处：受欢迎程度。通过允许其他开发者自由访问和在其开源软件基础上进行开发，Meta已经在整个AI生态系统中扩展了其影响力。

**开源系统有哪些风险？**
开源软件的批评者认为它安全性较差。在AI的情况下，一些人担心使用来自地缘政治对手如中国的模型可能对国家安全构成威胁，危及公民安全——例如通过收集大量用户数据用于监控目的。还有人担心，美国公司以不同开放程度提供其AI模型可能会给竞争对手国家机会，利用这些模型挑战美国的技术主导地位。

**为什么深寻选择“开放”路线？**
通过采取更加开放的方法（带有一些限制），深寻可能缓解了全球用户对中国技术严格控制的担忧。此外，通过使其他开发者更容易适应其聊天机器人的底层技术以满足他们的需求，深寻也可能扩大其在西方市场的影响力。换句话说，深寻有效地遵循了Meta用来占领更多AI生态系统的策略——这一事实似乎并未逃过Meta首席执行官马克·扎克伯格的注意。扎克伯格在接受《乔·罗根体验》采访时说：“这是一个巨大的地缘政治竞争，中国正在全力以赴。如果应该有一个每个人都使用的开源模型，我们应该希望它是美国模型。”

**那么深寻的模型是如何工作的？**
与最新的美国顶级开发商（包括OpenAI和谷歌）的模型类似，深寻的R1旨在模仿人类有时花时间思考问题的方式，然后响应用户的查询。然而，深寻版本基于该公司最近发布的另一款模型V3，与美国同行相比，它在效率方面有所不同。其背后的团队进行了创新。虽然竞争对手使用了大量的高性能计算机芯片来构建类似的AI模型，但深寻团队成员似乎找到了有效利用相对少量且不太先进的芯片的方法，考虑到美国对最尖端芯片的出口管制。他们还大量依赖一种称为强化学习的技术，该技术奖励正确答案，惩罚错误答案。在美国，一些技术和政策领导人承认了这些进展，但也提出了关于中国公司是否利用西方技术构建其聊天机器人，从而规避开发大型语言模型的巨大成本的问题。OpenAI表示正在审查深寻是否“不当提取”其模型以构建自己的竞争对手软件。深寻尚未对此指控作出回应。

**回顾一下。**
什么是蒸馏？
蒸馏指的是使用一家公司的AI输出来训练另一个模型——通常是较小、较弱的模型，使其具有相似的能力。一些公司，如OpenAI，表示使用其AI模型的输出来训练竞争模型违反了其使用条款。

**政府官员对开源有何看法？**
经过审查，2024年前总统乔·拜登的政府得出结论认为，现在对开源AI模型施加限制还为时过早，但也留下了未来可能有理由这么做的可能性。唐纳德·特朗普总统的政府尚未完全澄清其人工智能政策，但一些接近总统的人——包括埃隆·马斯克和副总统JD·瓦恩——此前曾强烈支持开源AI软件。然而，在深寻引发的骚动之后，白宫人工智能主管大卫·萨克斯暗示私营部门开发者可能会努力保护其模型免受蒸馏。

(以上内容均由Ai生成)