“最快的商业级”扩散 LLM 现已上市
快速阅读: 《印度分析杂志》消息,汞是Inception Labs推出的最快商业扩散模型,速度达GPT-4.1 Nano和Claude 3.5 Haiku的七倍,每秒生成超700个标记。其扩散架构通过逐步去噪提升效率与质量。
汞的性能可与GPT-4.1 Nano和Claude 3.5 Haiku相媲美,运行速度是其七倍以上。位于美国的AI初创公司Inception Labs推出了面向公众使用的汞,该公司声称这是目前最快的商业规模扩散大型语言模型(LLM)。该模型可在chat.inceptionlabs.ai以及如OpenRouter和Poe等第三方平台访问。
根据独立的人工智能模型评估平台Artificial Analysis的数据显示,汞的输出速度超过每秒700个标记,远高于Gemini 2.5 Flash每秒仅提供344个标记。此外,其性能也与OpenAI的小型模型GPT-4.1 Nano和Anthropic的Claude 3.5 Haiku相当。
汞还通过官方API提供,每百万输入/输出标记的成本为0.25至1美元。
Inception Labs于二月宣布了汞,并最近发布了该模型的技术报告。该模型的高速输出归功于其扩散架构,这种架构突破了传统语言模型的生成方式。
这种架构通常被称为扩散语言模型(Diffusion-LM),其工作方式与传统语言模型一次生成一个词或一个标记的方式不同。
“这种顺序过程可能较慢,并限制了输出的质量和连贯性。”谷歌在发布其扩散模型Gemini Diffusion时说道。
“扩散模型的工作方式不同。它们不是直接预测文本,而是通过逐步消除噪声来学习生成输出。这意味着它们可以在生成过程中快速迭代并进行错误修正。”该公司表示。
(以上内容均由Ai生成)