中国AI初创企业优化模型记忆机制以追赶西方对手
快速阅读: 中国AI开发者面对芯片限制,转向优化LLM算法,如“注意力”机制的混合形式,以高效架构超越西方。Moonshot AI和DeepSeek等公司力求在有限资源下保持竞争力。
随着获取先进芯片的渠道日益受限,中国的人工智能开发者将目光投向了解决大型语言模型(LLM)核心的算法瓶颈问题,寄希望于通过更高效的架构而非更强大的硬件来超越西方竞争对手。通过试验“注意力”机制的混合形式——这种机制使LLM能够处理和回忆信息——诸如Moonshot AI和DeepSeek这样的初创公司旨在在有限的计算资源下保持与全球领先者的同步发展。
(以上内容均由Ai生成)