Mistral 的新 Devstral 模型专为编码而设计
快速阅读: 据《雅虎美国》称,AI初创公司智谱推出专注编码的新模型“开发之星”,可免费商用,性能优于谷歌Gemini 3等模型,适合本地部署。智谱还提供API服务,按标记收费。
AI初创公司智谱(Mistral)于周三宣布推出一款专注编码的新AI模型——开发之星(Devstral)。智谱表示,这款由全心AI(All Hands AI)公司联合开发的模型采用Apache 2.0许可证公开发布,这意味着它能够无限制地应用于商业用途。智谱称,开发之星在SWE-Bench Verified(一个衡量编码能力的基准测试)中表现出色,超越了谷歌的Gemini 3 27B以及中国AI实验室深思(DeepSeek)的V3等其他开源模型。“开发之星擅长利用工具探索代码库,同时可以编辑多个文件,并为软件工程代理提供支持,”智谱在其提供给TechCrunch的博客文章中提到。“它可以在OpenHands或SWE-Agent等代码代理框架上运行,这些框架定义了模型与测试用例交互的接口……开发之星轻量到可以在单块[Nvidia] RTX 4090显卡或配备32GB内存的Mac上运行,使其成为本地部署和设备端使用的理想选择。”
以下是智谱内部对开发之星的基准评估结果。
图片来源:智谱
随着AI编程助手及其背后模型的日益普及,开发之星应运而生。就在上个月底,广受欢迎的应用开发工具公司捷波朗(JetBrains)发布了其首个面向编码的‘开源’AI模型。最近几个月,包括谷歌、风帆(Windsurf)和开放人工智能(OpenAI)在内的多家AI公司也推出了针对编程任务优化的模型,既有开源的也有专有的。尽管如此,AI模型在生成高质量代码方面仍面临挑战——代码生成AI往往会在引入安全漏洞和错误方面表现不足,这主要由于其在理解编程逻辑等方面的能力有限。然而,提升编码生产力的潜力正促使企业和开发者迅速接纳它们。近期的一项调查显示,去年有76%的开发者已经使用或将计划使用AI工具进行开发。
智谱此前涉足辅助编程领域时发布了代码之星(Codestral),这是一个用于代码生成的模型。但代码之星并未以允许开发者将其用于商业用途的许可发布;其许可明确规定禁止“员工在公司业务活动中进行任何内部使用”。智谱将开发之星称为“研究预览版”,可以从包括Hugging Face在内的AI开发平台获取,也可以通过智谱的API调用。每百万输入标记收费0.1美元,每百万输出标记收费0.3美元,标记是AI模型工作的原始数据片段。(一百万个标记大致相当于750,000个单词,或比《战争与和平》长约163,000个单词。)
(以上内容均由Ai生成)