Mistral AI 的新 OCR API 以每分钟 2,000 页的速度发展，旨在超越竞争对手

发布时间：2025年3月8日来源：szf

快速阅读: 据《eWeek 系列》称，法国人工智能公司Mistral推出了一款新型多模式OCR API，能高速、精准地处理文本、图像、表格等多种文档元素。相比谷歌、微软和OpenAI等竞争对手，Mistral OCR每分钟可处理高达2000页，支持多种语言。它将非结构化文档转化为AI友好格式，适用于科学研究、法律合规、历史保护及客户服务等多个领域。Mistral OCR现已在Mistral的开发者平台和主要云服务商上提供，价格为每1000页一美元。

（注：翻译和总结过程中已将所有英文内容翻译为中文）

eWEEK内容和产品推荐在编辑上是独立的。我们可能会在您点击我们的合作伙伴链接时赚取收入。了解更多信息。

法国人工智能公司Mistral的新光学字符识别（OCR）API速度极快，超精确且多模式，这意味着它可以准确识别并处理文本、图像、表格、方程式、手写笔记和其他文档元素。这可能极大地影响印刷文件转换为适合人工智能处理的格式的方式，因为大多数人工智能模型在处理干净、结构化的文本时效果最佳。如果其声称的单节点每分钟处理2000页的速度准确无误，它还将超越包括谷歌、微软和OpenAI在内的主要竞争对手，为处理大量文档的企业创造巨大的效率。以下是关于Mistral OCR你需要知道的内容。

**Mistral OCR有何不同？**

虽然传统的OCR工具主要集中在文本提取上，但Mistral OCR是多模式的。除了可以准确识别并处理文本外，它还能整齐地格式化各种其他元素，而不是形成杂乱无章的文本块，使AI驱动的应用程序更容易使用。除了声称单节点每分钟可处理高达2000页的速度外，它还支持多种语言，允许企业以不同的书写系统和字体数字化文档。相比之下，谷歌文档AI每分钟处理多达1800页，微软Azure OCR每分钟处理约600页，而OpenAI缺乏专用的OCR基准测试。这些差异突显了Mistral在处理大量文档方面的显著优势。

**Mistral OCR和人工智能：为什么重要**

许多公司难以将庞大的文档库转化为适合人工智能的形式。Mistral OCR通过将非结构化的PDF和图像转换为Markdown或JSON等AI准备格式解决了这个问题，这些格式常用于人工智能训练和自动化。这使得它尤其适用于检索增强生成（RAG）系统，该系统结合AI生成的内容和现有文档以获得更好的响应。律师事务所、研究机构和服务部门可以通过快速搜索和分析复杂的记录从中受益。

**为商业、研究等领域设计**

Mistral OCR目前在其AI助手Le Chat中使用，帮助用户提高PDF处理的准确性。它的应用范围也扩展到各个行业，包括：

– **科学研究**：将复杂的科研论文转化为适合人工智能处理的格式。
– **法律和合规性**：高效处理和组织法律文件、合同和合规报告。
– **历史保护**：数字化和索引历史文献和文物，以便更好地访问。
– **客户服务**：从手册和FAQ中自动提取知识，提高客户支持响应时间。

**可用性和定价**

Mistral OCR现在可在Mistral的开发者套件La Plateforme上使用，并将很快通过AWS、Azure和Google Cloud等云服务提供商提供。定价为每美元处理1000页，还有批量处理选项，可提高两倍效率。有严格安全需求的组织还可以选择本地部署，以确保敏感文件在其内部网络中得到保护。

(以上内容均由Ai生成)