Mistral AI 推出 OCR API,击败 Azure OCR、Google Gemini 和 OpenAI GPT-4o
快速阅读: 《印度分析杂志》消息,法国人工智能公司微斯塔尔AI近日发布了一款名为微斯塔尔OCR的新API,该工具能高效提取图像和PDF文件中的结构化文本、媒体、表格和公式。它已在多项基准测试中超越了领先模型,尤其擅长处理数学表达式、扫描文档和表格。微斯塔尔OCR支持多语言和多模态内容,每美元可处理1000页,且每分钟可处理多达2000页。该API支持自托管部署,适用于科学研究、历史保护及客户服务等多个领域。未来几周,公司将改进模型并增加本地化部署。
法国人工智能公司微斯塔尔AI近日发布了微斯塔尔OCR,这是一款强大的光学字符识别新API,可提升文档分析能力。该工具能够处理图像和PDF文件,准确提取结构化文本、媒体、表格和公式。“全球约90%的组织数据以文档形式存储,为了利用这一潜力,我们推出了微斯塔尔OCR,”微斯塔尔AI表示。该API与检索增强生成(RAG)系统集成,适用于处理多模态文档,如幻灯片和复杂PDF。微斯塔尔OCR现已成为勒查特上文档理解的默认模型,并通过API“微斯塔尔-OCR-最新版”提供服务,每美元处理1000页,批量推理效率翻倍。该API可在微斯塔尔开发套件拉平台访问,并将很快通过云服务、推理合作伙伴以及本地化部署方式提供。微斯塔尔OCR支持多语言和多模态内容,在基准测试中超越了领先的OCR模型。它在与谷歌文档AI、Azure OCR、杰米尼模型和GPT-4o的对比测试中得分94.89,尤其在数学表达式、扫描文档和表格方面表现出色。它能够处理各种手稿、字体和语言。“这种多功能性对于处理来自不同语言背景的文档的全球组织以及服务于特定市场的超本地企业至关重要,”该公司表示。该API在一个节点上每分钟可以处理多达2000页。它还支持“文档作为提示”功能,允许以JSON等格式提取结构化输出。此功能便于与下游工作流程集成。β用户正在使用微斯塔尔OCR进行科学研究、历史保护、客户服务和技术文献索引。研究机构利用它将学术论文转换为AI可用格式,而文化遗产组织则在数字化历史记录。客户服务团队正在将手册转化为可搜索的知识库。对于处理敏感数据的企业,微斯塔尔AI提供了自托管部署选项。“具有严格数据隐私要求的组织可以对其基础设施进行自托管,”该公司表示。微斯塔尔AI计划在未来几周内进一步改进模型并扩大本地化部署。
(以上内容均由Ai生成)