AI

抖音与LV-NUS联手推出SAIL-VL2,小模型大能力

发布时间:2025年10月14日    来源:szf
抖音与LV-NUS联手推出SAIL-VL2,小模型大能力

快速阅读: 抖音 SAIL 团队与 LV-NUS Lab 联合推出 SAIL-VL2 多模态大模型,参数规模小却在复杂推理任务中超越同类,8B 版本性能媲美 GPT-4,开源助力科研与应用。

在科技的浪潮中,抖音 SAIL 团队与 LV-NUS Lab 强强联手,推出了一款名为 SAIL-VL2的多模态大模型。这个新模型在保持较小参数规模的同时,竟然在复杂推理任务中超过了许多同类模型,甚至能与更大型的闭源模型相抗衡。这一突破性的进展无疑刷新了小模型的应用可能性。

SAIL-VL2的参数设置分为2B 和8B,在106个数据集上实现了性能的突破,尤其在 MMMU、MathVista 等复杂推理基准测试中表现优异。这个模型展示了一种新范式,即 “小模型也能有强能力”。为了确保这一点,SAIL-VL2在数据、训练及架构设计上进行了三大方面的创新。

在架构设计上,SAIL-VL2引入了稀疏混合专家(MoE),以优化性能和计算效率。其视觉编码器 SAIL-ViT 采用渐进式优化,逐步提升视觉 – 语言的对齐能力。这种创新设计使得 SAIL-VL2在推理时仅需激活部分参数,大幅度提升了模型的计算效率。

数据层面上,SAIL-VL2构建了高质量的多模态语料库,通过评分过滤和合成增强手段,确保数据的准确性和多样性。同时,团队还设计了一套渐进式的训练框架,从基础感知逐步过渡到复杂推理,使得模型在不同任务中的表现更加出色。

通过全链路优化,SAIL-VL2在基础模型的性能上取得了显著进展。数据显示,该模型在多项基准测试中脱颖而出,其8B 规模的模型在推理能力上,已然与 最新 的 GPT-4o 不相上下。这样的进展不仅为科研界带来了新的希望,也为未来多模态模型的应用开辟了新的道路。

SAIL-VL2的开源代码和模型也已在 GitHub 和 Hugging Face 上发布,便于研究者和开发者的使用与深入探索。无论是在学术研究还是工业应用中,SAIL-VL2都展现出强大的潜力与应用前景。

(以上内容均由Ai生成)

你可能还想读

荣耀YOYO智能体一键领券,Magic8系列轻松比价购物

荣耀YOYO智能体一键领券,Magic8系列轻松比价购物

快速阅读: 荣耀发布自进化AI原生手机Magic8系列,YOYO智能体实现自动领券、比价等功能,简化购物流程,提升用户体验,覆盖购物、美食、出行等多场景。 10 月 15 日,荣耀发布了首款自进化 AI 原生手机 —— 荣耀 Magic8 […]

发布时间:2025年10月23日
阿里Qwen升级Deep Research:一键生成报告、网页及播客

阿里Qwen升级Deep Research:一键生成报告、网页及播客

快速阅读: 阿里巴巴Qwen团队升级Deep Research工具,集成网页版Qwen Chat,提供研究至发布的全流程体验。新功能支持生成研究报告、交互式网页和多说话者播客,涵盖代码生成、图像渲染和语音合成功能,用户可直接使用无需配置基础 […]

发布时间:2025年10月23日
亚马逊测试AI配送眼镜,包裹导航与风险检测一镜完成

亚马逊测试AI配送眼镜,包裹导航与风险检测一镜完成

快速阅读: 亚马逊开发AI智能眼镜,提升送货司机配送效率与安全性,集成AI传感、计算机视觉等功能,支持自动调光与处方镜片定制,正在北美测试并将逐步推广。 【AIbase 报道】亚马逊周三宣布,正为旗下送货司机开发一款 AI 智能眼镜 ,旨在 […]

发布时间:2025年10月23日
通用汽车明年起搭载Google Gemini AI助手,提升驾驶体验

通用汽车明年起搭载Google Gemini AI助手,提升驾驶体验

快速阅读: 通用汽车宣布将在其2015年及以后车型中集成Google Gemini驱动的AI助手,提供导航、消息发送等服务,强调用户体验和隐私保护,标志着汽车行业智能化新阶段。 通用汽车周三在纽约 GM Forward 大会上宣布,将从明年 […]

发布时间:2025年10月23日
国家信息中心与摩尔线程达成战略合作,共推全国一体化算力网体系建设

国家信息中心与摩尔线程达成战略合作,共推全国一体化算力网体系建设

快速阅读: 国家信息中心与摩尔线程签署战略合作协议,共同推进全国一体化算力网体系建设,助力数字经济高质量发展,涵盖算力前瞻研究、产业生态培育等方面。 感谢IT之家网友 小星_14 的线索投递! IT之家 10 月 23 日消息,据国家信息中 […]

发布时间:2025年10月23日
荣耀 Magic8 开售,YOYO 智能体助力双 11 购物

荣耀 Magic8 开售,YOYO 智能体助力双 11 购物

快速阅读: 荣耀 Magic 8/Pro 开售,搭载 MagicOS 10 和 YOYO 智能体,助力“双十一”购物,解决比价、领券难题,提供全网优惠,覆盖生活多领域。 IT之家 10 月 23 日消息,10 月 23 日,荣耀 Magic […]

发布时间:2025年10月23日
欧洲报告揭示AI新闻助手准确性问题,谷歌Gemini表现最差

欧洲报告揭示AI新闻助手准确性问题,谷歌Gemini表现最差

快速阅读: 欧洲广播联盟和BBC报告显示,AI平台传播新闻存严重风险,影响新闻生态,Perplexity和谷歌AI加剧公众信任下降,研究发现来源、准确性和背景问题是主要障碍。 欧洲广播联盟和BBC发布的一份新报告显示,使用生成式人工智能平台 […]

发布时间:2025年10月23日
AI热潮推动美股大涨,ChatGPT引发21万亿市值增长

AI热潮推动美股大涨,ChatGPT引发21万亿市值增长

快速阅读: 特朗普退让提振市场情绪,但股市上涨主因是AI热潮。自2022年11月ChatGPT推出以来,美国标普500指数市值增加21万亿美元。 特朗普倾向于退让提振了市场情绪,但推动股市上涨的主要动力是围绕生成式人工智能(AI)的炒作。在 […]

发布时间:2025年10月23日