DeepSeek 的成功使中国大学成为焦点
快速阅读: 据《大学世界新闻》称,随着中国生成式AI平台DeepSeek的成功,其年轻开发团队引起了广泛关注。该团队由约30名本土科学家和技术人员组成,大多毕业于中国顶尖大学如北大、清华,少数有海外学习背景。DeepSeek创始人梁文峰强调注重能力和创造力而非经验。尽管中美在AI领域竞争激烈,DeepSeek的成功表明中国本土人才培养的重要性。
随着上个月发布的中国生成式人工智能平台DeepSeek的成功,该平台年轻开发团队的大学背景在中国和国际上引起了巨大的兴趣。这个团队被视为展示新一代本土人才的代表。建立仅一年多,总部位于中国东部城市杭州的AI创业公司DeepSeek于1月20日发布了其新的开源大型语言模型(LLM),震惊了全球。其最新版本DeepSeek-R1在性能上与美国的OpenAI的GPT-1相当,但该公司表示其总训练成本仅为557.6万美元——只是其美国竞争对手支出的一小部分。该公司被描述为一个“类似大学”的AI实验室,没有商业化的紧迫感。
此后,人们的注意力转向了DeepSeek背后的团队,这支约30人的年轻本土科学和技术团队从默默无闻中脱颖而出,而不是来自中国的顶级科技公司。DeepSeek拥有大约150名员工,但据报道,它为有潜力的候选人提供高薪。梁文峰(39岁),公司的创始人兼CEO,在2023年接受中国媒体采访时提到,技术岗位主要由应届毕业生或“有一两年工作经验的人”担任。梁文峰在浙江大学完成了本科和硕士学位,他说选择早期职业生涯的人才符合公司挑选人才的理念,即注重能力而非经验。梁文峰引用说:“如果你追求短期目标,找到有经验的人是正确的选择。但从长远来看,经验并不那么重要,基本能力、创造力、热情等更为重要。从这个角度来看,中国有很多合适的候选人。”
梁文峰表示,尽管许多顶尖AI人才仍然来自中国以外,但他认为“我们自己也能培养出这样的人才”。梁文峰指出,“由于社会层面的重大突破创新太少,顶尖人才在中国往往被低估”,这意味着他们没有机会被发现。梁文峰的评论是在中美之间日益激烈的AI主导权竞争中,AI科学家们被吸引回国之际提出的。最近斯坦福大学的一项研究显示,自2018年特朗普政府启动旨在调查数百名华裔和华裔美国人涉嫌间谍行为的中国倡议以来,离开美国回到中国的华裔科学家数量增加了75%。
艾伦指出,团队中有一名成员曾是斯坦福大学的访问学者。深入研究了大约30名核心团队成员的学术背景后,他发现了一些海外联系。例如,DeepSeek-VL2(R1的早期版本)的论文作者中,有一位曾在澳大利亚蒙纳士大学学习,另一位则在德克萨斯大学奥斯汀分校学习。然而,大多数团队成员都在北京的顶尖中国大学如北京大学和清华大学接受了培训。艾伦解释说:“团队似乎由年轻的毕业生组成,其中许多人最近刚刚从顶尖的中国院校毕业。”他说,“很多人在过去几年获得了硕士或博士学位。一些人仍然在读研究生。这是一支非常年轻的团队,成员大多在20多岁。”
艾伦表示,团队中缺乏所谓的‘海归’(指在国外学习后回国的学生)这一现象很有趣,因为多年来,趋势是中国学生在美国学习并带回创新成果。“有一种观点认为,中国大学无法与美国或其他世界领先者在高级研究方面匹敌。”他指出。但艾伦说,DeepSeek的成功似乎反驳了这些说法。“仍然有一些人在国外受过训练——我看到了新加坡、日本,但只有极少数人与美国大学有联系。我认为我没有看到任何欧洲大学,”他补充道。
教授的影响
艾伦进一步调查了中国大学核心团队教授的情况,以确定团队主管是否有海外培训经历,这可能对他们产生影响。在中国的大学实验室里,教授和研究生经常要一起工作很长时间。他发现北京大学主导了研究生导师名单。“实际上,许多训练出这些学生的教授也没有在美国受过教育,而是在中国接受教育,这是一个非常有趣的发现,”他说。“清华大学也毫不意外地在整个DeepSeek团队中留下了印记,”艾伦说,但“来自清华大学的所有教职顾问都没有海外学位”。
艾伦从初步调查中注意到,北京大学计算机科学学院副教授熊英飞博士是极少数拥有海外教育背景的人之一。虽然他拥有电子科技大学的本科学位,但他的博士学位是在日本东京大学获得的,并随后在加拿大滑铁卢大学继续深造。另一位研究生导师高圣华现在是香港大学的副教授,但他拥有新加坡南洋理工大学的博士学位。一些教授与与中国军事相关的大学有关联,这些大学被称为“国防七子”,受到了美国和其他西方国家的出口管制和其他制裁。其中包括北京航空航天大学、哈尔滨工业大学和西北工业大学。艾伦指出,这可能会引发一些担忧。他提到,2020年,美国政府对来自这些大学的学生赴美留学实施了限制。
(以上内容均由Ai生成)