华为人工智能实验室否认其盘古模型之一抄袭了阿里巴巴的 Qwen
快速阅读: 《印度快运》消息,华为模型引发争议,被指“再利用”而非自研。论文称可能存在侵权和虚假信息。华为称其模型有重大创新,并基于昇腾芯片开发。
这表明,华为的模型是通过“再利用”获得的,并非从零开始训练。论文指出,这在互联网上和中国科技媒体中引发了广泛讨论。广告继续如下:该论文还指出,其研究结果表明可能存在版权侵权行为,技术报告中存在虚假信息,以及对华为在训练模型上的投资的不实声明。
诺亚方舟实验室在其声明中表示,该模型“并非基于其他厂商模型的渐进式训练”,并且“在架构设计和技术特性方面进行了重大创新”。它补充称,这是首个完全基于华为昇腾芯片开发的大规模模型。广告继续如下:它还表示,其开发团队严格遵守了任何第三方代码使用所涉及的开源许可要求,但并未详细说明参考了哪些开源模型。
阿里巴巴未立即回应路透社的评论请求。路透社未能联系到HonestAGI,也未能了解该实体背后的负责人。
今年1月,中国初创公司DeepSeek发布了开源模型R1,其低成本令硅谷感到惊讶,并引发了中国科技巨头之间争夺市场优势的竞争。广告继续如下:Qwen 2.5-14B于2024年5月发布,是阿里巴巴的小型Qwen 2.5模型家族之一,可在个人电脑和智能手机上运行。
尽管华为早在2021年就推出了自主开发的Pangu模型,进入了大型语言模型领域,但此后一直被看作落后于竞争对手。它于6月下旬在中国开发者平台GitCode上开源了Pangu Pro Moe模型,旨在通过向开发者提供免费访问来推动其AI技术的应用。
虽然Qwen更面向消费者,并拥有类似ChatGPT的聊天机器人服务,但华为的Pangu模型更多用于政府以及金融和制造行业。
(以上内容均由Ai生成)