DeepSeek 是 Qwen 的 AI 工程师的真正来源

发布时间:2025年2月17日    来源:szf
DeepSeek 是 Qwen 的 AI 工程师的真正来源

快速阅读: 据《亚洲时报》称,近期,深寻和阿里巴巴的通义千问成为关注焦点。深寻-R1由16位核心贡献者开发,部分成员曾与微软亚洲研究院合作。阿里巴巴的通义千问由达摩院支持,拥有强大的顾问团队。两者均助力中国产业升级,应对美国脱钩制裁。据称,中国国家主席习近平将主持会议,提振私营部门信心,阿里巴巴和深寻创始人将出席。

近期,深寻和阿里巴巴的通义千问人工智能平台成为了中国和美国技术专家及投资者关注的热点话题。然而,关于中国工程团队的具体信息依然稀缺。《亚洲时报》通过对这两款聊天机器人开发者背景的公开信息进行分析,可能有助于更清晰地了解深寻和通义千问的发展历程。根据公开的研究论文和媒体报道,深寻和通义千问的工程团队之间没有合作关系或成员重叠。两者唯一的关联在于,深寻的研究团队在一篇于今年1月22日发表的论文中提到,他们“提炼”了通义千问2.5和Meta的Llama,以此为基础开发了深寻-R1。深寻-R1的发布在1月底引发了美国股市的下跌。一些分析师认为,作为一个开源人工智能平台,深寻可能也采用了“知识蒸馏”技术从OpenAI的ChatGPT中提取数据来训练其人工智能模型。然而,目前尚无确凿证据证明其确实如此。

根据1月22日的论文,深寻-R1有16位核心贡献者,其中一些人与微软亚洲研究院(MSRA)和中国计算机学会(CCF)有直接联系。核心贡献者吴宇在2014年至2019年期间在北京航空航天大学攻读博士学位时,受到MSRA的周明教授指导。他在2013年至2019年期间一直是MSRA的全职实习生,并于2019年加入该研究院担任副研究员。核心贡献者郭大亚在2018年至2023年期间在广州中山大学攻读博士学位时,受到MSRA的段楠教授指导。他在2020年至2023年期间由段楠指导,在2017年至2020年期间由MSRA自然语言计算组的唐都宇指导。

当然,深寻团队与MSRA研究人员之间的联系并不意味着MSRA持有杭州公司的任何股份。但如果美国对中国科技行业施加更多压力,MSRA可能不得不暂停在中国的工作和实习项目。2023年初,据称由于担忧这些学校与中国人民解放军有关联,MSRA停止从中国七所大学和北京邮电大学招募实习生。被列入美国制裁名单的西北工业大学(NPU)和哈尔滨工业大学(HIT)也在其中。

由马云创立的中国阿里巴巴集团在杭州开发了其聊天机器人。阿里巴巴利用其电子商务业务的现金流,于2017年成立了达摩院,致力于人工智能研究。达摩院的英文名称为“发现、探索、动力和展望”。该学院聘请了10位知名教育家和研究人员组成顾问委员会,其中6位来自美国,4位来自中国大学。阿里巴巴任命阿里云首席技术官周靖仁负责达摩院。周靖仁在美国哥伦比亚大学获得了计算机科学博士学位。在2016年7月加入阿里巴巴前,他曾是微软的研发合作伙伴,任职四年。

负责通义千问数据处理的算法工程师周畅于2017年加入达摩院。在加入阿里巴巴之前,他已经与阿里巴巴的一些软件工程师合作过几个项目,并在2017年与他们共同撰写过两篇论文。北京大学的高军教授也是合著者之一。高军于2003年在北京大学获得博士学位,并发表了超过30篇研究论文。他的项目得到了中国863计划和国家自然科学基金的支持。1986年3月,200名顶尖中国科学家向当时的中国领导人邓小平提出了863计划。同年11月,政府设立了这一计划。

2022年,周畅与包括北京大学的崔斌在内的几位学者共同撰写了一篇研究论文。崔斌还领导了一些得到863计划资助的项目。崔斌现任北京大学计算机科学学院副院长,同时也是中国计算机学会数据库技术委员会副主任。去年7月,周畅决定带领约10名工程师加入字节跳动。据报道,阿里巴巴对周畅提起诉讼,声称他无权加入竞争对手。

阿里巴巴的研究团队似乎拥有比深寻更强大的顾问委员会,并且在数据管理研究领域有着更长的历史。这可能是为什么阿里巴巴能够开发通义千问2.5,一个原创的人工智能模型,而深寻仅发布了其他人工智能模型的蒸馏版本。这也可能是苹果公司最近与阿里巴巴合作推出人工智能驱动的iPhone的原因。

IT专栏作家阿曼达·卡斯韦尔在最近的文章中写道,通义千问2.5在其设定的所有七个测试中都优于深寻-R1。她说通义千问2.5提供的答案更有条理且易于理解,而深寻-R1的回答则显得缺乏深度和原创性。

从北京的角度看,通义千问和深寻同样重要,因为它们助力中国产业升级,并应对美国的脱钩和制裁。据报道,中国国家主席习近平将很快主持一次会议,以提振私营部门的信心。阿里巴巴联合创始人马云和深寻创始人梁文锋将出席。永健是《亚洲时报》的撰稿人。他是一位专注于中国科技、经济和政治领域的中国记者。

(以上内容均由Ai生成)

你可能还想读

攻关 6G“拐点技术”:国星宇航 × 北京邮电大学共建语义卫星联合实验室

攻关 6G“拐点技术”:国星宇航 × 北京邮电大学共建语义卫星联合实验室

快速阅读: 国星宇航与北京邮电大学共建语义卫星联合实验室,聚焦语义卫星星座建设等关键技术,加速太空AI技术转化与应用落地,推动6G通信发展。 IT之家 10 月 22 日消息, 国星宇航今日宣布,将携手北京邮电大学共建语义卫星联合实验室 。 […]

发布时间:2025年10月23日
贝索斯展望太空数据中心:利用恒定阳光解决AI能耗问题

贝索斯展望太空数据中心:利用恒定阳光解决AI能耗问题

快速阅读: 贝索斯提出在太空中建立数据中心的构想,利用不间断太阳能解决能源问题,但面临高昂的发射和维护成本及技术挑战。 贝索斯设想在地球大气层外利用持续阳光建立轨道数据中心。该计划承诺提供无限能源,不受云层和天气干扰的影响。然而,发射和维护 […]

发布时间:2025年10月11日
克瑞托斯庆祝Oriole火箭25年辉煌成就

克瑞托斯庆祝Oriole火箭25年辉煌成就

快速阅读: Kratos开发的Oriole火箭因2012年推出的TVC系统而性能大幅提升,完成多次高精度任务,支持全球多地点发射,助力高超音速研究,至今累计140次成功发射,确立行业领先地位。 Oriole的成功之旅因Kratos在2012 […]

发布时间:2025年10月11日
国际首个,北邮第一代“卫星互联网防火墙”安全载荷成功发射

国际首个,北邮第一代“卫星互联网防火墙”安全载荷成功发射

快速阅读: 北京邮电大学研发的“卫星互联网防火墙”安全载荷成功发射,实现物理层与网络层协同防护,具备10Gbps高并发流量检测能力,为卫星互联网安全提供重要保障。 感谢IT之家网友 tellMe 的线索投递! IT之家 9 月 19 日消息 […]

发布时间:2025年9月19日
ICEYE推出战术级太空情报系统ISR Cell

ICEYE推出战术级太空情报系统ISR Cell

快速阅读: ICEYE推出ISR Cell集装箱系统,使国防组织能现场获取近乎实时的太空ISR数据,加速高风险环境决策。系统已验证,提供更快、更可靠的情报,覆盖各决策层。预计2026年初交付,扩展军事客户基础。 美国加利福尼亚州洛杉矶(SP […]

发布时间:2025年9月13日
深学环形塑形技术助力天文观测,深化宇宙理解

深学环形塑形技术助力天文观测,深化宇宙理解

快速阅读: 科研团队开发的深度环路整形技术,显著提升了LIGO引力波观测站的控制精度和稳定性,降低了噪声水平,有助于天文学家更准确地研究宇宙动力学和形成过程,开启了下一代引力波科学的大门。 我们新开发的深度环路整形技术改进了引力波观测站的控 […]

发布时间:2025年9月5日
月球探索新突破!AI 助力撞击坑研究,效率提升惊人

月球探索新突破!AI 助力撞击坑研究,效率提升惊人

快速阅读: 中国科学院地球化学研究所发布“月球科学多模态专业大模型V2.0”,大幅提升月球地质研究效率,未来将向全球开放“数字月球”云平台。 在全球科技迅速发展的今天,中国科学家正借助人工智能的力量,推动月球科学研究的新进展。近日,在202 […]

发布时间:2025年9月1日
我国风云卫星已与 17 个阿拉伯国家共享,推进多项气象合作

我国风云卫星已与 17 个阿拉伯国家共享,推进多项气象合作

快速阅读: 中国将与阿联酋、约旦、埃及等国合作,共建气象卫星数据应用中心,研发灾害早期预警系统,开发气象人工智能模型,提升阿拉伯地区灾害性天气预报能力。 IT之家 8 月 29 日消息,据央视报道,我国将与阿联酋、约旦以及埃及等国家共同开展 […]

发布时间:2025年8月29日