百度发布Qianfan-VL开源模型，昆仑芯助力多模态AI突破

发布时间：2025年9月25日来源：szf

快速阅读: 百度发布Qianfan-VL系列多模态大模型，涵盖3B、8B和70B三个版本，特别在OCR和教育领域表现突出，支持昆仑芯P800芯片，功耗低效率高。

百度在AIGC领域迎来新里程碑，正式开源其最新的视觉理解模型——Qianfan-VL。该系列模型共有三个版本，分别为3B、8B和70B参数量，适用于不同应用场景。引人关注的是，Qianfan-VL系列的训练完全依赖于百度自研的昆仑芯P800芯片，充分展示了国产芯片在人工智能领域的强大实力。

Qianfan-VL被称为多模态大模型，具备同时理解图像和文本的能力。例如，它可以分析复杂图表中的数据和趋势。在核心能力方面，Qianfan-VL在OCR（光学字符识别）和教育场景优化上表现尤为突出。用户只需拍摄身份证，模型就能自动识别姓名和证件号，实现全场景文字识别。无论面对的是印刷体、手写字，还是复杂的数学公式，它都能轻松识别并提取信息，转换为结构化数据。

在教育领域，Qianfan-VL被定位为“超级学霸”，能够帮助学生拍照解题，进行几何推理和函数分析。根据测试结果，70B版本的Qianfan-VL在科学问答测试ScienceQA中获得98.76的高分，远超同类产品。同时，在中文多模态基准测试CCBench中，该版本也以80.98的高分脱颖而出，显示出其在中文语境下的强大理解力。

支持Qianfan-VL训练的昆仑芯P800芯片，具有极佳的功耗控制，150W至160W的功耗使其在大规模集群中展现出显著的能耗和散热优势。P800的独特架构设计将计算单元与通信单元分离，优化了芯片的利用效率。通过“通算融合”技术，实现了数据传输与计算过程的无缝衔接，大幅提升了模型训练性能。

Qianfan-VL的底层架构融合了多个业界优秀成果，并采用了创新的“四阶段训练管线”方法，确保模型在训练过程中既具备扎实的通识基础，又掌握专业知识。目前，Qianfan-VL全系列模型已在GitHub和Hugging Face等平台上开源，供企业和开发者自由使用，同时百度智能云的千帆平台也提供了在线体验与部署服务。

划重点：

– 百度Qianfan-VL系列模型正式开源，涵盖3B、8B和70B三个版本，满足不同场景需求。

– 模型具备强大的多模态能力，尤其在OCR和教育领域表现出色。

– 昆仑芯P800芯片支持模型训练，功耗低且效率高，优化了大规模计算性能。

(以上内容均由Ai生成)