DeepSeek 是 Qwen 的 AI 工程师的真正来源
快速阅读: 据《亚洲时报》称,近期,深寻和阿里巴巴的通义千问成为关注焦点。深寻-R1由16位核心贡献者开发,部分成员曾与微软亚洲研究院合作。阿里巴巴的通义千问由达摩院支持,拥有强大的顾问团队。两者均助力中国产业升级,应对美国脱钩制裁。据称,中国国家主席习近平将主持会议,提振私营部门信心,阿里巴巴和深寻创始人将出席。
近期,深寻和阿里巴巴的通义千问人工智能平台成为了中国和美国技术专家及投资者关注的热点话题。然而,关于中国工程团队的具体信息依然稀缺。《亚洲时报》通过对这两款聊天机器人开发者背景的公开信息进行分析,可能有助于更清晰地了解深寻和通义千问的发展历程。根据公开的研究论文和媒体报道,深寻和通义千问的工程团队之间没有合作关系或成员重叠。两者唯一的关联在于,深寻的研究团队在一篇于今年1月22日发表的论文中提到,他们“提炼”了通义千问2.5和Meta的Llama,以此为基础开发了深寻-R1。深寻-R1的发布在1月底引发了美国股市的下跌。一些分析师认为,作为一个开源人工智能平台,深寻可能也采用了“知识蒸馏”技术从OpenAI的ChatGPT中提取数据来训练其人工智能模型。然而,目前尚无确凿证据证明其确实如此。
根据1月22日的论文,深寻-R1有16位核心贡献者,其中一些人与微软亚洲研究院(MSRA)和中国计算机学会(CCF)有直接联系。核心贡献者吴宇在2014年至2019年期间在北京航空航天大学攻读博士学位时,受到MSRA的周明教授指导。他在2013年至2019年期间一直是MSRA的全职实习生,并于2019年加入该研究院担任副研究员。核心贡献者郭大亚在2018年至2023年期间在广州中山大学攻读博士学位时,受到MSRA的段楠教授指导。他在2020年至2023年期间由段楠指导,在2017年至2020年期间由MSRA自然语言计算组的唐都宇指导。
当然,深寻团队与MSRA研究人员之间的联系并不意味着MSRA持有杭州公司的任何股份。但如果美国对中国科技行业施加更多压力,MSRA可能不得不暂停在中国的工作和实习项目。2023年初,据称由于担忧这些学校与中国人民解放军有关联,MSRA停止从中国七所大学和北京邮电大学招募实习生。被列入美国制裁名单的西北工业大学(NPU)和哈尔滨工业大学(HIT)也在其中。
由马云创立的中国阿里巴巴集团在杭州开发了其聊天机器人。阿里巴巴利用其电子商务业务的现金流,于2017年成立了达摩院,致力于人工智能研究。达摩院的英文名称为“发现、探索、动力和展望”。该学院聘请了10位知名教育家和研究人员组成顾问委员会,其中6位来自美国,4位来自中国大学。阿里巴巴任命阿里云首席技术官周靖仁负责达摩院。周靖仁在美国哥伦比亚大学获得了计算机科学博士学位。在2016年7月加入阿里巴巴前,他曾是微软的研发合作伙伴,任职四年。
负责通义千问数据处理的算法工程师周畅于2017年加入达摩院。在加入阿里巴巴之前,他已经与阿里巴巴的一些软件工程师合作过几个项目,并在2017年与他们共同撰写过两篇论文。北京大学的高军教授也是合著者之一。高军于2003年在北京大学获得博士学位,并发表了超过30篇研究论文。他的项目得到了中国863计划和国家自然科学基金的支持。1986年3月,200名顶尖中国科学家向当时的中国领导人邓小平提出了863计划。同年11月,政府设立了这一计划。
2022年,周畅与包括北京大学的崔斌在内的几位学者共同撰写了一篇研究论文。崔斌还领导了一些得到863计划资助的项目。崔斌现任北京大学计算机科学学院副院长,同时也是中国计算机学会数据库技术委员会副主任。去年7月,周畅决定带领约10名工程师加入字节跳动。据报道,阿里巴巴对周畅提起诉讼,声称他无权加入竞争对手。
阿里巴巴的研究团队似乎拥有比深寻更强大的顾问委员会,并且在数据管理研究领域有着更长的历史。这可能是为什么阿里巴巴能够开发通义千问2.5,一个原创的人工智能模型,而深寻仅发布了其他人工智能模型的蒸馏版本。这也可能是苹果公司最近与阿里巴巴合作推出人工智能驱动的iPhone的原因。
IT专栏作家阿曼达·卡斯韦尔在最近的文章中写道,通义千问2.5在其设定的所有七个测试中都优于深寻-R1。她说通义千问2.5提供的答案更有条理且易于理解,而深寻-R1的回答则显得缺乏深度和原创性。
从北京的角度看,通义千问和深寻同样重要,因为它们助力中国产业升级,并应对美国的脱钩和制裁。据报道,中国国家主席习近平将很快主持一次会议,以提振私营部门的信心。阿里巴巴联合创始人马云和深寻创始人梁文锋将出席。永健是《亚洲时报》的撰稿人。他是一位专注于中国科技、经济和政治领域的中国记者。
(以上内容均由Ai生成)