Mistral 推出新的代码嵌入模型,在实际检索任务中性能优于 OpenAI 和 Cohere

发布时间:2025年5月29日    来源:szf
Mistral 推出新的代码嵌入模型,在实际检索任务中性能优于 OpenAI 和 Cohere

快速阅读: 《VentureBeat 公司》消息,法国AI公司米斯特拉尔推出新款代码斯特拉嵌入模型,性能优于同行,适用于代码检索、语义搜索等多种场景,但面临市场竞争压力。

订阅我们的每日和每周简报,获取关于行业前沿人工智能报道的最新资讯和独家内容。了解更多随着对企业检索增强生成(RAG)需求的增加,为企业提供嵌入模型解决方案的机会已经成熟。法国人工智能公司米斯特拉尔推出了其首款嵌入模型——代码斯特拉嵌入模型,并声称在SWE-Bench等基准测试中超越现有嵌入模型的表现。该模型专精于代码领域,在真实世界代码数据的检索场景中表现出色。该模型对开发者的定价为每百万标记符0.15美元。该公司表示,代码斯特拉嵌入模型明显优于主流代码嵌入器,如voyage code 3、cohere嵌入版本v4.0以及openai的嵌入模型,即text embedding 3 large。代码斯特拉嵌入模型作为米斯特拉尔代码斯特拉编码模型系列的一部分,能够将代码和数据转化为数值表示,用于RAG。“代码斯特拉嵌入模型能够输出不同维度和精度的嵌入,下图展示了检索质量与存储成本之间的平衡,”米斯特拉尔在其博客文章中表示。“即使维度为256且精度为int8的代码斯特拉嵌入模型仍然优于我们竞争对手的任何模型。我们的嵌入维度按相关性排列。对于任意整数目标维度n,您可以选择保留前n个维度以在质量和成本之间实现平滑权衡。”

米斯特拉尔在多个基准测试中对该模型进行了测试,包括GitHub上的SWE-Bench和Text2Code。在两种情况下,该公司表示代码斯特拉嵌入模型都优于领先的嵌入模型。

SWE-Bench
Text2Code

使用案例

米斯特拉尔表示代码斯特拉嵌入模型针对“高性能代码检索”和语义理解进行了优化。该公司表示,该代码最适合至少四种使用案例:RAG、语义代码搜索、相似度搜索和代码分析。

嵌入模型通常针对RAG使用案例,因为它们可以加快任务或代理过程的信息检索速度。因此,代码斯特拉嵌入模型专注于此并不令人意外。

米斯特拉尔表示代码斯特拉嵌入模型针对“高性能代码检索”和语义理解进行了优化。该公司表示,该代码最适合至少四种使用案例:RAG、语义代码搜索、相似度搜索和代码分析。

该模型还可以执行语义代码搜索,允许开发人员使用自然语言查找代码片段。这种用例非常适合开发者工具平台、文档系统和编码助手。

代码斯特拉嵌入模型还可以帮助开发人员识别重复的代码段或类似的代码字符串,这对有重用代码政策的企业来说非常有用。

米斯特拉尔表示代码斯特拉嵌入模型针对“高性能代码检索”和语义理解进行了优化。该公司表示,该代码最适合至少四种使用案例:RAG、语义代码搜索、相似度搜索和代码分析。

该模型支持语义聚类,即将代码根据功能或结构分组。这种用例有助于分析存储库、分类和发现代码架构中的模式。

嵌入领域的竞争正在加剧

米斯特拉尔在发布新模型和代理工具方面一直表现良好。它发布了米斯特拉尔中型3号,这是其旗舰大型语言模型(LLM)的中型版本,目前为其面向企业的平台Le Chat Enterprise提供动力。它还宣布了代理API,允许开发人员访问创建执行现实任务的代理并协调多个代理的工具。

米斯特拉尔向开发人员提供更多模型选项的举措在开发社区中并未被忽视。一些人在X上指出,米斯特拉尔发布代码斯特拉嵌入模型的时机“正值竞争加剧之际”。然而,米斯特拉尔必须证明代码斯特拉嵌入模型不仅在基准测试中表现良好。

尽管它与openai和cohere等更封闭的模型竞争,代码斯特拉嵌入模型也面临着来自qodo的开源选项的竞争,包括qodo-embed-1-1.5 b。

《VentureBeat》联系了米斯特拉尔询问代码斯特拉嵌入模型的许可选项。VB每日商业用例洞察

如果你想给老板留下深刻印象,VB每日可以帮你做到。我们为你提供公司如何使用生成式人工智能的内部信息,从监管变化到实际部署,以便你可以分享见解以获得最大回报。现在订阅查看我们的隐私政策感谢订阅,请继续关注更多VB新闻通讯。出现的问题

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日