Cohere 推出 Embed 4:新的多模式搜索模型可处理 200 页的文档
快速阅读: 据《VentureBeat 公司》称,Cohere发布嵌入4代模型,提升上下文理解和多模态处理能力,助力企业挖掘数据洞见。模型支持多种语言及复杂数据格式,适用于金融、医疗等行业,可优化代理和AI助手性能,降低存储成本。立即订阅获取更多AI资讯。
订阅我们的每日和每周简报,获取行业领先的人工智能覆盖的最新更新和独家内容。了解更多企业检索增强生成(RAG)仍然是当前代理型人工智能热潮的核心。利用对代理的持续兴趣,Cohere发布了其嵌入模型的最新版本,具有更长的上下文窗口和更多的多模态功能。Cohere 的嵌入4代建立在嵌入3代的多模态更新基础上,并在非结构化数据方面增加了更多能力。由于有128,000个标记的上下文窗口,组织可以为大约200页的文档生成嵌入。“现有的嵌入模型无法自然理解复杂的多模态商业资料,促使公司开发繁琐的数据预处理流程,仅能稍微提高准确性,”Cohere 在一篇博客文章中表示。“嵌入4代解决了这个问题,帮助企业及其员工高效挖掘隐藏于海量不可搜索信息中的洞见。”
企业可以在虚拟私有云或本地技术堆栈中部署嵌入4代,以增加数据安全性。公司可以生成嵌入,将文档或其他数据转化为数值表示形式,用于RAG使用案例。然后,代理可以引用这些嵌入来回答提示。
领域特定知识
Cohere 表示,嵌入4代在金融、医疗和制造等受监管行业中表现出色。专注于企业人工智能用例的 Cohere 表示,其模型考虑了受监管行业的安全需求,并对企业有很强的理解力。该公司训练嵌入4代“能够抵御真实世界中的噪声数据”,即使在企业数据存在拼写错误和格式问题等“缺陷”的情况下,仍能保持准确性。“它在扫描文档和手写内容的搜索方面也表现良好。这些格式在法律文件、保险发票和费用收据中很常见。这一能力消除了复杂的数据准备或预处理流程的需求,为企业节省时间和运营成本,”Cohere 表示。
组织可以使用嵌入4代进行投资者演示、尽职调查文件、临床试验报告、维修指南和产品文档。该模型支持超过100种语言,与前一版本相同。
Agora 创始人 Param Jaggi 在博文中提到:“电子商务数据复杂,包含图像和多方面的文本描述。能够以统一的嵌入表示我们的产品,让我们的搜索更快速,内部工具更高效。”
代理用例
Cohere 认为像嵌入4代这样的模型会改善代理用例,并声称它可以成为企业中代理和人工智能助手的最佳搜索引擎。“除了在各种数据类型上的强大准确性外,该模型还提供了企业级效率,”Cohere 表示。“这使其能够扩展以满足大型组织的需求。”
Cohere 还表示,嵌入4代创建压缩数据嵌入以降低高存储成本。嵌入和基于RAG的搜索让代理可以引用特定文档来完成与请求相关的任务。许多人认为这些提供了更准确的结果,确保代理不会给出错误或虚构的答案。
Cohere 对抗的其他嵌入模型包括Qodo的Qodo-Embed-1-1.5B和Voyage AI的模型,后者是数据库供应商MongoDB最近收购的。
每日业务应用场景洞察
如果你想给老板留下深刻印象,VB Daily 可以帮到你。我们为你提供公司如何使用生成式人工智能的内幕消息,从监管变化到实际部署,以便你可以分享见解以获得最大回报。立即订阅阅读我们的隐私政策感谢订阅。查看更多VB 时事通讯。发生错误。
(以上内容均由Ai生成)