Mistral AI 推出“Document AI”平台,声称 OCR 准确率达到 99%
快速阅读: 据《印度分析杂志》称,法国AI初创公司“微星AI”推出文档AI平台,OCR处理速度快且准确,支持多种语言和复杂文档格式,适用于文档生命周期自动化管理,同时发布开源AI模型“代码星”和多模态模型“微星小模型3.1”。
法国人工智能初创公司“微星AI”(Mistral AI)于周四推出了一款全新企业级文档人工智能平台,声称在基于光学字符识别(OCR)的文档处理速度和准确性方面树立了新标杆。该平台能够解析从低分辨率扫描件到手写表格等多种复杂内容,被定位为处理大量文件业务的完整解决方案。
该公司表示,该平台采用了最先进的OCR引擎,在全球超过11种语言中达到了99%以上的准确率。与传统系统不同,传统系统难以应对混合布局问题,“微星AI”的人工智能可以解释复杂的文档,包括表格、图表、合同和发票,并将其转换为带有自定义提取模板的结构化JSON文件。据称,单个GPU的处理速度可达到每分钟2000页,使其成为同类产品中最快的一款工具之一。使用来自华盛顿公共电力供应系统的几十年前的法律合同进行的演示显示,该平台能够将密集段落、遗留格式和嵌入条款解析为清晰的结构化输出。即使是手写笔记、审计免责声明以及历史设备交付记录,也能以超越旧系统的精度被提取出来。
文档AI还包括用于自动化整个文档生命周期的AI工具,从数字化和分类到合规监控。它支持本地部署和私有云部署模式,适用于具有严格数据主权规则的行业。“微星AI”进入文档智能领域紧随企业向档案数字化和合规工作流自动化的更广泛趋势。对于仍然被纸质文件困扰的研究机构和跨国公司来说,这可能非常有用。就在“微星AI”推出面向现实编码任务的开源AI模型“代码星”(Devstral)之后不久,该模型在SWE-Bench上获得了46.8%的分数,表现优于同行。它可以在消费级硬件上运行,并且可以在Hugging Face等平台上获得。该公司最近还推出了“微星小模型3.1”(Mistral Small 3.1),这是其最先进的多模态、多语言、开源模型,可在Apache许可证下使用。对于仍然被纸质文件困扰的企业而言,“微星AI”的最新动作表明OCR或许终于准备好承担关键任务了。
(以上内容均由Ai生成)