AI

阿里AI团队发布Ovis2.5,实现经济型视觉推理新突破

发布时间:2025年8月19日    来源:szf
阿里AI团队发布Ovis2.5,实现经济型视觉推理新突破

快速阅读: 阿里国际数字贸易集团发布Ovis2.5多模态大语言模型,具备原生分辨率感知、深度推理能力和图表OCR领先优势,为多模态AI应用树立新标杆。

阿里国际数字贸易集团(AIDC)的AI团队(AIDC-AI)近日发布了全新多模态大语言模型Ovis2.5,提供9B和2B两种参数规模版本。该模型定位为经济型视觉推理解决方案,在其规模内展现出卓越性能,为多模态AI应用树立了新标杆。

Ovis2.5的核心特性包括:

1. **原生分辨率感知**:Ovis2.5采用NaViT视觉编码器,无需损耗平铺即可保留图像的精细细节和全局结构,确保高质量的视觉处理能力。

2. **深度推理能力**:模型支持可选的“思考模式”,可能部分复用了阿里Qwen3的技术特性。除了线性思维链(CoT)推理外,Ovis2.5还能进行自我检查和修订,并支持可配置的思考预算,提升问题解决的精准度。

3. **图表与文档OCR领先**:在9B和2B规模上,Ovis2.5在复杂图表分析、文档理解(包括表格和表单)以及光学字符识别(OCR)领域达到业内领先水平,为实际应用场景提供强大支持。

4. **广泛任务覆盖**:该模型在图像推理、视频理解和视觉定位基准测试中表现出色,展现了强大的通用多模态能力。

Ovis2.5的发布彰显了AIDC-AI在多模态AI技术领域的持续创新。通过在紧凑模型规模内实现高性能,Ovis2.5为开发者和企业提供了一种高效且易于部署的解决方案,尤其适用于需要视觉与文本推理结合的场景。模型已在GitHub和Hugging Face等平台开源,进一步推动全球AI社区的协作与创新。

此次发布是AIDC-AI在Ovis系列模型基础上取得的又一重要进展,为多模态大语言模型的发展注入了新的活力。

(以上内容均由Ai生成)

你可能还想读

亚马逊推Alexa+迈入全代理AI时代

亚马逊推Alexa+迈入全代理AI时代

快速阅读: 据外媒报道,亚马逊推出新一代智能体AI系统Alexa+,中兴与字节跳动联合研发全球首款全智能体AI手机,该技术正加速渗透医疗健康领域,可自主执行复杂任务并提升服务效率。 近日,全球人工智能领域加速向“智能体”(agentic A […]

发布时间:2025年12月8日
网传普京持《薄伽梵歌》照片系AI生成

网传普京持《薄伽梵歌》照片系AI生成

快速阅读: 据媒体报道,近日网传普京在专机手持《薄伽梵歌》的照片系AI合成,经事实核查机构BOOM验证含谷歌SynthID水印,该虚假图像由屡传不实信息的账号首发,旨在制造地缘政治误导。 近日,一张据称显示俄罗斯总统普京在专机上手持《薄伽梵 […]

发布时间:2025年12月8日
AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

快速阅读: 据最新消息,AMD Ryzen 7 9850X3D工程样品在多款主板上运行稳定,单核频率近5.6GHz,Zen 5架构优化显著,平台兼容性良好,有望近期发布。 近日,有关AMD即将推出的Ryzen 7 9850X3D处理器的最新 […]

发布时间:2025年12月8日
英特尔BMG-G31显卡即将发布

英特尔BMG-G31显卡即将发布

快速阅读: 据最新消息,英特尔将BMG-G31显卡纳入软件支持体系,该芯片配备32个Xe2核心与16GB显存,预计2026年初以Arc B770命名亮相,旨在强化中高端GPU市场竞争力。 英特尔公司近日正式将代号为“Big Battlema […]

发布时间:2025年12月8日
戴尔Pro笔记本:AI时代企业首选

戴尔Pro笔记本:AI时代企业首选

快速阅读: 据国际数据公司(IDC)报道,戴尔推出Dell Pro系列AI商用笔记本,搭载NPU与Windows 11 Copilot+,支持长效续航、军工级耐用性及本地AI安全防护,助力企业提升效率并降低长期更新成本。 随着2025年接近 […]

发布时间:2025年12月8日
英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日