阶跃星辰发布321亿参数大模型Step 3
快速阅读: 据相关媒体最新报道,7月27日,阶跃星辰发布新一代大模型Step3,参数达321亿,具备多模态推理能力。计划7月31日开源,提升推理效率,与多家企业合作推动应用落地。
记者获悉,7月27日,上海,阶跃星辰在2025世界人工智能大会(WAIC2025)前夕,发布了其新一代基础大模型——Step3。这款模型不仅在智能性上取得突破,还提升了推理效率,旨在为企业和开发者提供最优的应用方案。Step3计划于7月31日正式开源,标志着阶跃星辰向全球开源社区贡献了一款强大的多模态推理模型。
为了推动大模型的应用落地,阶跃星辰联合多家国内领先的芯片和平台厂商,成立了“模芯生态创新联盟”。该联盟旨在通过模型与芯片产业链的创新合作,加速大模型在各行业的应用。同时,阶跃星辰还与上海国有资本投资有限公司达成战略合作,以加强资本和生态业务的协作。
阶跃星辰创始人兼CEO姜大昕表示,从Step1到Step2的快速迭代,使团队更加关注客户的真实需求。新一代Step3模型被定义为推理时代最佳应用模型,具备强智能、低成本、可开源和多模态等特征。Step3是阶跃星辰首个全尺寸的原生多模态推理模型,参数量高达321亿,其中激活参数量为38亿。它在视觉感知和复杂推理方面表现出色,能够处理跨领域的知识理解和视觉信息分析。
为了提升模型的推理效率,阶跃星辰在架构设计上进行了创新,使得Step3在不同硬件平台上的推理表现出色。根据测试,Step3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且在与NVIDIA Hopper架构芯片的分布式推理中,吞吐量提升超过70%。
阶跃星辰建立了“1+N”的模型矩阵,其中“1”指的是Step3,“N”则是多个多模态模型,涵盖语音、视觉理解和图像生成等领域。通过与近10家芯片及基础设施厂商的合作,阶跃星辰致力于提升大模型的适配性和算力效率,从而推动应用的落地。
(以上内容均由AI生成)