DeepSeek 发布 AI 推理模型更新
快速阅读: 《西澳大利亚人》消息,中国AI初创公司深鉴智算推出R1推理模型更新版R1-0528,虽在代码生成上略逊于OpenAI,但优于其他竞争者。该公司技术突破挑战了AI需巨额资源的传统观念,推动全球技术竞争新格局。
中国人工智能初创公司深度求索(深鉴智算)发布了其R1推理模型的更新版本,进一步加剧了与美国竞争对手(如OpenAI)的竞争态势。
深度求索在开发者平台Hugging Face上推出了R1-0528,但尚未进行正式的公开发布。不过,外界并未获取到该模型的详细描述或性能对比信息。然而,根据加州大学伯克利分校、麻省理工学院和康奈尔大学研究人员开发的LiveCodeBench基准测试结果显示,深度求索更新后的R1推理模型在代码生成方面略逊于OpenAI的o4 mini和o3推理模型,但在xAI的Grok 3 mini和阿里巴巴的Qwen 3之上。
据彭博社周三报道,一位深度求索代表在一个微信群中提到已完成“小规模试验升级”,用户可以开始测试。
今年早些时候,深度求索打破了外界关于美国出口管制阻碍中国人工智能发展的看法,因为这家初创公司在成本仅为美国领先行业模型一小部分的情况下,发布了性能相当甚至更优的人工智能模型。R1于一月份的发布引发了中国以外科技股的大幅波动,并挑战了“发展人工智能需要大量计算资源和投入”的传统认知。自R1发布以来,阿里巴巴和腾讯等中国科技巨头相继推出宣称超越深度求索的模型。
此外,谷歌的Gemini推出了分级访问折扣,而OpenAI则降价并发布了依赖较少计算资源的o3 Mini模型。
预计R2,即R1的继任者,仍会发布。路透社三月援引知情人士消息称,R2原计划于五月发布。同时,深度求索还于三月发布了V3大型语言模型的升级版。
深度求索的不断突破不仅展现了其技术实力,也为中国人工智能领域注入了更多活力,同时也为全球技术竞争格局带来了新的变数。
(以上内容均由Ai生成)