AI

上海AI实验室发布多模态大模型书生·万象 InternVL3.5

发布时间:2025年9月1日    来源:szf
上海AI实验室发布多模态大模型书生·万象 InternVL3.5

快速阅读: 上海人工智能实验室发布多模态大模型InternVL3.5,涵盖1B至241B参数,刷新开源模型性能标准,推理性能显著提升,支持多种任务,提供不同尺寸模型满足各类需求。

8月31日,上海人工智能实验室发布多模态大模型书生·万象InternVL3.5。该模型采用创新的级联式强化学习、动态视觉分辨率路由与解耦部署架构,提升了推理能力、部署效率与通用能力。InternVL3.5涵盖1B至241B各尺寸参数的全量级版本,刷新了开源模型性能标准,在多种任务上达到领先水平。

InternVL3.5的旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获得77.7分,多模态通用感知基准MMStar和OCRBench分别取得77.9分和90.7分,超越GPT-5的75.7分和80.7分。文本推理基准AIME25和MMLU-Pro分别达到75.6和81.3分,全面领先现有开源多模态大模型。依托级联式强化学习框架,全系列模型推理性能比上一代平均提升16.0分。其中,InternVL3.5-241B-A28B综合推理性能达到66.9分,超越上一代模型的54.6分及Claude-3.7-Sonnet的53.9分,在数学推理、逻辑推理等复杂任务中表现出色。

借助创新的视觉分辨率路由与解耦部署框架,38B模型在896分辨率下的响应速度大幅提升,单次推理延迟由369毫秒缩短至91毫秒,提升约4倍。同时,轻量化的InternVL3.5-Flash在将视觉序列长度减少50%的情况下,仍能保持接近100%的性能水平。

InternVL3.5还增强了GUI智能体、具身智能体、SVG图形理解与生成等智能体核心能力,在ScreenSpot GUI定位、VSI-Bench空间推理、SGP-Bench矢量图理解等任务中超越主流开源模型。

InternVL3.5提供10亿至2410亿参数共九种尺寸模型,覆盖不同资源需求场景,包括稠密模型和专家混合模型,是首个支持GPT-OSS语言模型基座的开源多模态大模型。官方提供了使用`transformers`运行`InternVL3.5-8B`的示例代码,模型最多可以在单张A100 GPU上部署,而38B模型需要2张A100 GPU,235B模型则需要8张A100 GPU。

ms-swift支持对InternVL3.5系列模型进行训练。ms-swift是魔搭社区提供的大模型与多模态大模型训练部署框架。用户可以将数据准备成特定格式进行自定义数据集微调。训练完成后,可以使用相应命令进行推理,并将模型推送到ModelScope。

InternVL3.5的发布标志着多模态大模型技术的又一重要进展,为研究人员和开发者提供了强大工具,推动多模态人工智能的发展。

代码开源/模型使用方法:https://github.com/OpenGVLab/InternVL

模型合集:https://www.modelscope.cn/collections/InternVL35-Full-3871e58bf21349

在线体验:https://chat.intern-ai.org.cn/

(以上内容均由Ai生成)

你可能还想读

芯纬内部人士抛售超10亿美元股票引发警报

芯纬内部人士抛售超10亿美元股票引发警报

快速阅读: 纳斯达克上市公司CoreWeave因内部人士大量抛售股票受关注,10月交易超10亿美元,股价承压下跌,引发投资者对该公司信心的质疑。 纳斯达克上市的CoreWeave (CRVW)因内部人士大量抛售股票而受到广泛关注。10月,一 […]

发布时间:2025年10月24日
升腾首席分析与AI官:用数学背景解决医疗问题

升腾首席分析与AI官:用数学背景解决医疗问题

快速阅读: 安森斯首席分析与人工智能官卡提克·拉贾强调,人工智能是一类问题而非单一事物,需识别并应用正确方法解决。他领导团队利用AI优化医疗流程,提高决策效率,同时注重人才培养和道德领导。 卡提克·拉贾,这家覆盖16个州的大型医疗系统首席分 […]

发布时间:2025年10月24日
格拉斯利宣布法官使用AI致法庭命令出错,实施新政

格拉斯利宣布法官使用AI致法庭命令出错,实施新政

快速阅读: 美国参议院司法委员会主席格拉斯利宣布收到法官们关于AI导致法院命令出错的回应,法官温盖特和尼尔斯承认错误并实施新政策,确保命令准确性,同时法院行政办公室成立AI咨询工作组,发布临时指导方针。 美国参议院司法委员会主席查克·格拉斯 […]

发布时间:2025年10月24日
AI视频生成系统不断进步,ChatGPT创始人更新发展计划

AI视频生成系统不断进步,ChatGPT创始人更新发展计划

快速阅读: 本周,顶尖开发者公布人工智能视频生成系统的最新进展,包括即将推出的安卓应用。该技术融合多种特性,引发艺术与伦理讨论,但仍不断进步,输出效果惊人。 基于人工智能的视频生成系统集多种特性于一身。的确,它们引发了关于艺术、创作者角色及 […]

发布时间:2025年10月24日
美法官承认职员用AI起草错误命令

美法官承认职员用AI起草错误命令

快速阅读: 美国地方法官温盖特承认其法律助理使用AI程序起草了有误的法院命令,引发争议。温盖特表示将加强审查流程,避免类似错误。参议员格拉斯利呼吁制定更明确的AI使用政策。 密西西比州的一名联邦法官承认,其工作人员使用人工智能起草了一份有误 […]

发布时间:2025年10月24日
ChatGPT遭遇重大故障,用户报告服务中断

ChatGPT遭遇重大故障,用户报告服务中断

快速阅读: ChatGPT遭遇重大技术故障,OpenAI确认“高频率错误”,用户反馈广泛。故障始于周四上午11时(美国东部时间),Downdetector数据显示问题激增。 受连续强降雨影响,南部多地出现洪水,相关部门紧急启动防汛响应。Ch […]

发布时间:2025年10月24日
OpenAI推新浏览器Atlas,挑战Google Chrome

OpenAI推新浏览器Atlas,挑战Google Chrome

快速阅读: OpenAI推出ChatGPT Atlas浏览器,挑战谷歌Chrome,集成AI功能助用户高效完成任务,计划近期增加标签组和广告拦截器等新特性。 萨姆·阿尔特曼的OpenAI继续将其生成式AI模型整合到全球大多数人的日常工具—— […]

发布时间:2025年10月24日
ChatGPT短暂故障后恢复,医疗咨询模式引关注

ChatGPT短暂故障后恢复,医疗咨询模式引关注

快速阅读: 医学研究人员报告AI医疗失误案例,患者因咨询ChatGPT致溴化物中毒精神错乱。专家长期担忧此问题,OpenAI推出专门医疗建议模式应对。 几周前,一位医学研究人员报告了一起由AI引发的医疗失误案例,详细描述了一名患者因咨询Ch […]

发布时间:2025年10月24日