AI

阿里AI团队发布Ovis2.5,实现经济型视觉推理新突破

发布时间:2025年8月19日    来源:szf
阿里AI团队发布Ovis2.5,实现经济型视觉推理新突破

快速阅读: 阿里国际数字贸易集团发布Ovis2.5多模态大语言模型,具备原生分辨率感知、深度推理能力和图表OCR领先优势,为多模态AI应用树立新标杆。

阿里国际数字贸易集团(AIDC)的AI团队(AIDC-AI)近日发布了全新多模态大语言模型Ovis2.5,提供9B和2B两种参数规模版本。该模型定位为经济型视觉推理解决方案,在其规模内展现出卓越性能,为多模态AI应用树立了新标杆。

Ovis2.5的核心特性包括:

1. **原生分辨率感知**:Ovis2.5采用NaViT视觉编码器,无需损耗平铺即可保留图像的精细细节和全局结构,确保高质量的视觉处理能力。

2. **深度推理能力**:模型支持可选的“思考模式”,可能部分复用了阿里Qwen3的技术特性。除了线性思维链(CoT)推理外,Ovis2.5还能进行自我检查和修订,并支持可配置的思考预算,提升问题解决的精准度。

3. **图表与文档OCR领先**:在9B和2B规模上,Ovis2.5在复杂图表分析、文档理解(包括表格和表单)以及光学字符识别(OCR)领域达到业内领先水平,为实际应用场景提供强大支持。

4. **广泛任务覆盖**:该模型在图像推理、视频理解和视觉定位基准测试中表现出色,展现了强大的通用多模态能力。

Ovis2.5的发布彰显了AIDC-AI在多模态AI技术领域的持续创新。通过在紧凑模型规模内实现高性能,Ovis2.5为开发者和企业提供了一种高效且易于部署的解决方案,尤其适用于需要视觉与文本推理结合的场景。模型已在GitHub和Hugging Face等平台开源,进一步推动全球AI社区的协作与创新。

此次发布是AIDC-AI在Ovis系列模型基础上取得的又一重要进展,为多模态大语言模型的发展注入了新的活力。

(以上内容均由Ai生成)

你可能还想读

AI浏览器大战爆发,巨头争相布局未来

AI浏览器大战爆发,巨头争相布局未来

快速阅读: 本周《Vergecast》讨论ChatGPT Atlas及新AI浏览器频出,影响AI未来。探讨三星Galaxy XR可穿戴AI设备前景,关注华纳兄弟探索公司待售及其复杂历史。 本周在《Vergecast》节目中,我们讨论了Cha […]

发布时间:2025年10月24日
美国AI未来关键:数据中心而非妖魔化目标

美国AI未来关键:数据中心而非妖魔化目标

快速阅读: 美国数据中心发展面临公众反对与能源挑战,但其对AI及数字经济至关重要。如孟菲斯xAI项目,虽引发环保争议,却带来巨额投资与就业机会。 人工智能是一项定义时代的技术,其应用范围涵盖了国防、医疗、法律和金融等多个领域。在未来的十年里 […]

发布时间:2025年10月24日
OpenAI推多项改进,优化ChatGPT Atlas浏览器体验

OpenAI推多项改进,优化ChatGPT Atlas浏览器体验

快速阅读: OpenAI推出AI驱动浏览器ChatGPT Atlas,增加广告拦截、标签组支持等功能,提升用户体验,解决1Password等扩展程序兼容问题,计划开发Windows和Android版本。 日前,OpenAI宣布推出其人工智能 […]

发布时间:2025年10月24日
中国拟立法强化AI安全与发展

中国拟立法强化AI安全与发展

快速阅读: 中国《网络安全法》修正案草案将提交全国人大常委会审议,新增人工智能安全健康发展条款,旨在应对新挑战,加强个人数据保护,支持基础研究和关键算法创新,改善基础设施,建立伦理规范。 2025年7月26日,一名参观者在上海东部举行的20 […]

发布时间:2025年10月24日
Gemini新功能泄露:圈选图片区域获取AI信息

Gemini新功能泄露:圈选图片区域获取AI信息

快速阅读: 《Android Authority》报道,安卓平台Gemini新版本正开发一项功能,用户可圈选上传图片中的特定区域供AI处理,以获取更精确的图像信息。 《Android Authority》深入研究了安卓平台上的最新Gemin […]

发布时间:2025年10月24日
微软推出可爱AI助手Mico,重启Clippy新时代

微软推出可爱AI助手Mico,重启Clippy新时代

快速阅读: 微软发布Copilot秋季更新,推出Mico这一友好且具情感的AI形象,旨在实现更人性化的AI互动,支持可选图形助手,增强对话体验,融合情感与效率。 微软通过其Copilot秋季更新改变了我们与人工智能互动的方式。此次更新不仅带 […]

发布时间:2025年10月24日
EA联手Stability AI加速3D游戏设计

EA联手Stability AI加速3D游戏设计

快速阅读: Krafton宣布转型为AI主导公司,将在运营、学习、管理等领域嵌入AI技术,推进AI工作流程自动化及游戏内AI服务,提升游戏品质。 相关新闻, 《绝地求生》(PUBG)的开发商Krafton宣布将转型为以人工智能为主的公司,在 […]

发布时间:2025年10月24日
IBM在AMD芯片上实现量子算法,加速商业化进程

IBM在AMD芯片上实现量子算法,加速商业化进程

快速阅读: IBM宣布在AMD芯片上成功运行关键量子计算算法,标志超级计算机商业化进展。此算法可解决量子位错误,提前一年完成,计划2029年推出Starling量子计算机。 旧金山 — IBM于周五宣布,其能够在Advanced Micro […]

发布时间:2025年10月24日