在中国,随着中国人对 DeepSeek 的狂热,国内的 AI 竞争愈演愈烈
快速阅读: 《海峡时报》消息,中国AI新星深寻因其聊天机器人和高性能AI模型受到热捧,春节期间用户量激增。深寻的成功不仅提升公众信心,还激励更多投资和竞争。尽管中国AI公司在全球排名中表现亮眼,但深寻的独立发展路径仍具独特性。专家认为,深寻的成功将加速中国AI的整体发展,并增强其全球竞争力。
北京/深圳——中国人工智能(AI)新星深寻正迎来它的高光时刻,中国的用户对其聊天机器人爱不释手。在2月4日结束的为期八天的中国春节假期期间,普通民众用他们的出生数据——即“八字”——查询这家初创公司的高性能免费聊天机器人,它成了算命师,为他们提供关于爱情、生活和财富的建议。其他人则在社交媒体上分享发现,深寻的R1推理模型能够进行类人对话、推荐健身训练,并创作诗歌。还有一些人利用深寻的各种AI模型来准备中国竞争激烈的公务员考试。“深寻打破了圈层限制——许多普通人现在可以免费使用如此先进的AI技术,这提升了他们对这种技术的信心。”香港科技大学(广州)人工智能专业的硕士研究生李若冲(23岁)告诉《海峡时报》。“破圈”一词在线上被用来形容某事物已获得主流认可,而不仅仅是小圈子内的粉丝或爱好者所关注。
然而,深寻的聊天机器人并不是第一个出现在中国市场的生成式AI模型。该公司成立于2023年,当时中国科技巨头如电商平台阿里巴巴、搜索引擎百度和抖音的创造者字节跳动也推出了各自的AI模型——阿里巴巴推出了开源Qwen,百度推出了ERNIE Bot,字节跳动推出了Douyao。
深寻之所以在国内和国际上声名鹊起,是因为其V3大型语言模型(LLM)和R1推理模型,这些模型在最近两个月内发布,与美国的ChatGPT等世界顶级产品相比具有相似的效果,但成本仅为后者的零头,并且没有使用最先进的芯片。如今,深寻的成就可能通过吸引更多投资和人才进入该行业,催化中国开发更强大、更有用的AI模型的竞争。目前,一些竞争对手如阿里巴巴、字节跳动和Moonshot AI已经发布了更新版本的模型,给深寻和美国的OpenAI带来了挑战。所有人都在关注中国是否能保持这样的突破速度,以在2030年前实现成为全球AI领导者的雄心。
自从2022年底OpenAI的ChatGPT将生成式AI技术引入公众视野以来,中国一直在追赶。公司竞相开发自己的模型,政府也在支持这一领域的发展。中国政府通过国家基金投资了AI企业,包括2025年1月宣布的一项规模达600亿元人民币(约110亿美元)的国家级AI产业投资基金。据一项美国研究显示,在2000年至2023年间,中国政府风险投资基金向超过9600家AI领域的公司投资了1840亿美元(约合2490亿美元)。政府还建立了包括数据中心和计算集群在内的AI基础设施。
如今,在聊天机器人竞技场——一个全球开发者广泛使用的LLM评估和排名平台中,前20名中有9个席位由中国公司占据(美国占11个)。如果以最新的前沿模型作为基准,那么中国模型已经缩小了与国际顶尖水平的差距,包括来自美国的模型。“很明显……自2022年ChatGPT推出以来,中国取得了显著进展,当时中国还没有真正的等效产品——主要是因为国内很少有研究人员从事LLM相关工作。如今,中国拥有一个深厚且强大的人才库,正在最高水平上积极竞争。”
看来,中国政府的支持政策和资金投入在一定程度上缩小了中国与西方在生成式AI模型方面的差距。在中国LLM初创企业中的领军人物被称为“六只小老虎”——智谱AI、MiniMax、百川AI、Moonshot AI、StepFun和01.ai——他们的创始人与学术界或顶级科技公司如谷歌和微软有着密切联系。每家公司估值超10亿美元,它们从私人风投、大型公司以及部分国有实体那里筹集资金。
打破常规
然而,突破性的AI模型却来自深寻,据一些人说,这并非由于政府培育的创新体系,而是尽管存在这种体系。深寻被视为现有生态系统中的例外。它更像是一个由一群年轻且才华横溢的团队发起的热情项目,几乎没有考虑商业化,也没有面临大公司那样的盈利压力。麻省理工学院博士生谭J.S.在媒体平台Substack上表示,该公司并未依赖国家支持的计划或科技巨头的投资。相反,其创始人梁文峰个人资助了公司的运营,谭写道。梁文峰在2015年创立对冲基金High-Flyer后成为亿万富翁。“这使其能够独立于通常与国家或企业资助相关的限制条件运作,”谭在1月29日的帖子中写道。
当被问及为何深寻不同时专注于开发模型及其潜在应用时,梁文峰在7月2024年接受中国媒体采访时说,他认为随着中国经济的增长,中国必须从技术的受益者转变为贡献者。“我们的目标不是快速获利,而是推动技术前沿,从根本上促进整个生态系统的增长。”
深寻的成功鼓舞了中国的AI公司,因为它部分基于中国先前的LLM工作,包括阿里巴巴的开源Qwen。但是,其他中国AI公司可能难以复制深寻的成功组织结构,这有助于其实现突破,AI研究员Neil Zhu说。他是上海安全AGI中心的创始人,这是一个致力于与中国合作伙伴合作,制定人工智能安全部署方法的非营利机构。他指的是公司的扁平化和灵活设置,以及梁文峰对研究的亲自参与。鉴于创始人的资源,该公司可以采取长期的研究方法,并且在计算能力方面超越了许多其他公司。
尽管如此,深寻的成功给国家资助的参与者带来了适应和创新的压力,并开辟了新的合作和投资渠道。“这种动态格局有望加速中国AI的发展,增强其国内产业和全球竞争力,”新加坡国立大学商学院教授James Pang说。
林敏章是《海峡时报》驻北京记者,他对中国的政治、科技、国防和外交政策感兴趣。林Joyce ZK是《海峡时报》驻深圳的中国记者。深寻的开源热潮打破了美国对AI的幻想,深寻对中国北京和硅谷都构成了挑战。
(以上内容均由Ai生成)