Catalyst DeepSeek:颠覆行业的中国人工智能初创公司
快速阅读: 据《中国国际电视台》最新报道,2025年人工智能行动峰会即将在巴黎举行,中国人工智能公司深寻因其实力引发广泛关注。深寻仅用两年时间就在其模型R1上取得突破,且训练成本远低于西方同行。该公司对开源的承诺引起科技界震动,影响资本市场和英伟达股价。深寻创始人梁文峰认为开源是吸引全球顶尖人才的战略举措,而非单纯商业决策。赵洋将在后续文章中解析深寻的技术创新及其对全球市场的影响。
VCG编者按:2025年人工智能行动峰会将于下周在巴黎举行。上个月,中国人工智能公司深寻(DeepSeek)在全球市场引起了轩然大波,无疑使中国的声音和解决方案成为峰会的焦点。从今天起,我们将发布CGTN科技记者兼评论员赵洋的三篇评论文章《深寻催化剂》。在今天的章节中,我们将回顾深寻引发的连锁反应,并探索其创始人的技术理念。无论你是否关注科技新闻,你可能都听说过深寻。这家成立仅两年的中国初创公司在其最新模型深寻R1上取得了令人震惊的突破。尽管训练成本仅为西方同行的一小部分,R1的推理能力可与OpenAI的O1相媲美。但真正让深寻脱颖而出的是它对开源的承诺——允许任何人自由使用、下载甚至在当地部署自己的AI模型。这一举动在科技界引发了震动,动摇了资本市场,甚至影响了英伟达的股价。很难想象,深寻在中国春节这样一个传统上用于家庭聚会和轻松交谈的时间段内,吸引了全国范围内的讨论。这种尖端技术的发展盖过了节日话题的风头,成为了全国讨论的中心。有趣的是,去年春节期间也出现了类似的现象,当时OpenAI的Sora成为了最热门的创新话题。连续两年,最大的人工智能新闻都出现在中国最重要的节日期间。深寻并非凭空出现。业内观察人士一直在密切关注这家公司。过去几周,大部分热议集中在R1上,这是一个类似于OpenAI的O1的推理模型。然而,许多深寻最惊人的突破,例如其极低的训练成本,在去年年底推出V3时就已经显现。事实上,V3背后的许多创新早在2024年初的V2版本中就已首次亮相。这就是为什么深寻长期以来一直被视为人工智能社区的新星。在过去几周里,全球云服务提供商竞相将深寻的模型集成到他们的平台上,不愿错过由深寻引发的人工智能热潮。除了证明中国在人工智能领域的竞争力日益增强外,深寻的成功也引发了中国科技巨头的深刻反思:为何最具颠覆性的人工智能突破来自一家没有商业压力的初创公司,而不是来自资金雄厚的行业巨头?
我在早先采访深寻创始人时找到了一些答案。深寻的掌舵人梁文峰,其前一家企业是高飞者(High-Flyer),这是中国顶级的量化对冲基金之一。高飞者完全依赖于AI驱动的投资策略,没有人工交易员。这种背景赋予了梁和他的团队对人工智能的深刻理解。与许多急于商业化的企业不同,深寻从一开始就选择了开源。这一决定不仅仅是为了财务独立——在创始人看来,这是一次战略性的举措,旨在吸引全球顶尖人才。正如梁曾经所说,“面对颠覆性技术,封闭模型的竞争壁垒只是暂时的。真正的壁垒在于团队的成长、技术积累以及持续创新的文化。”他进一步阐述道,“对于技术人才来说,看到别人在其创新基础上发展是一种极大的成就感。开源更多是一种文化哲学而非商业策略——它赢得了尊重。对公司而言,这样做也有文化吸引力。”
预告:明天的文章将用浅显易懂的方式解释深寻如何通过技术创新降低了训练成本,并对全球市场产生了影响。
关于作者:赵洋负责CGTN的科学、技术和环境报道。他还创立了CGTN的Tech It Out工作室,该工作室制作了多部获奖的科学纪录片,包括《人类碳足迹》、《建筑智能》和《多样性之地》。
(以上内容均由Ai生成)