Mistral AI发布OCR3模型准确率提升74%

发布时间：2025年12月19日来源：szf

快速阅读: 据Mistral AI消息，该公司近日发布Mistral OCR3文档识别技术，在表格、手写文本及复杂表单识别上准确率较前代提升74%，支持高精度提取文本与图像并输出为Markdown格式，每千页处理成本低至1美元，已应用于发票处理与档案数字化等企业流程。

近日，Mistral AI发布最新文档识别技术Mistral OCR3，标志着其在文档处理能力上取得重要进展。该技术在表格、扫描件、复杂表单及手写文本识别方面表现突出，整体准确率较前代产品OCR2提升74%。

Mistral OCR3可从多类型文档中高精度提取文本与嵌入图像，并支持输出为Markdown格式，同时基于HTML重构表格，便于下游系统理解内容结构。其体积小巧、成本可控，每处理1000页文档仅需2美元；通过批量API调用，费用还可进一步降至1美元。

为更贴近实际应用需求，该技术引入了更严苛的内部评测基准，重点优化真实业务场景下的识别性能。相比早期模型，其在手写识别、表单解析及复杂文档处理等方面实现显著升级，能够适配更多样化的文档类型。

目前，Mistral OCR3已应用于高容量企业流程与交互式文档工作流。开发者可利用该技术自动解析发票、合规表格等文件，并完成手写或历史档案的数字化。早期用户在发票处理、公司档案数字化及技术报告提取等领域已取得积极成效。

行业分析指出，高效提取高保真文本与图像的能力，是支撑生成式人工智能和智能体发展的关键基础。具备此类技术的企业有望充分释放数据价值，在竞争中占据优势。

(以上内容均由Ai生成)

引用自：AIbase人工智能资讯平台

你可能还想读