新的嵌入模型排行榜重组:谷歌获得 #1,而阿里巴巴的开源替代方案缩小差距
快速阅读: 据《VentureBeat 公司》称,谷歌Gemini嵌入模型正式上线,MTEB排名第一,支持100多种语言,定价合理。竞争激烈,OpenAI、Cohere等公司也推出相关模型,开源选项如Qwen3-Embedding同样表现优异。
据谷歌博客报道,8月5日,谷歌正式宣布其高性能Gemini嵌入模型进入一般可用阶段。该模型在大规模文本嵌入基准测试(MTEB)中排名首位,现已集成到Gemini API和Vertex AI中,助力开发人员构建语义搜索和检索增强生成(RAG)等应用。
虽然谷歌的模型表现优异,但嵌入模型市场竞争激烈。谷歌的专有模型面临来自OpenAI、Mistral和Cohere等公司的挑战。特别是Cohere推出的Embed 4模型,专门针对企业文档中的“噪声数据”进行了优化,适合金融和医疗等行业的使用需求。
此外,开源社区也提供了多个强大的嵌入模型。阿里巴巴的Qwen3-Embedding模型在MTEB榜单上紧随Gemini之后,适用于多种商业场景。Qodo的Qodo-Embed-1-1.5B则专注于代码领域,表现出色。
谷歌将Gemini嵌入模型定位为一个统一的解决方案,支持100多种语言,定价合理,每百万个输入标记0.15美元。该模型具备高度灵活性,可调整嵌入维度以适应不同的应用场景,帮助企业平衡模型精度、性能和存储成本。
对于已经使用Google Cloud和Gemini系列模型的企业,采用原生嵌入模型可带来无缝集成和简化的MLOps流程。然而,对于重视数据主权、成本控制或希望在自有基础设施上运行模型的企业,开源选项如Qwen3-Embedding提供了可靠的替代方案。
(以上内容均由Ai生成)