美团发布LongCat-Flash-Omni,引领全模态实时交互新纪元

发布时间:2025年11月3日    来源:szf
美团发布LongCat-Flash-Omni,引领全模态实时交互新纪元

快速阅读: 美团发布LongCat-Flash-Omni模型,采用ScMoE技术,实现低延迟实时音视频交互,参数达5600亿,性能优异,支持多模态应用场景,吸引大量开发者关注。

9月1日,美团正式发布了LongCat-Flash系列模型,并近期开源了LongCat-Flash-Chat和LongCat-Flash-Thinking两个版本,吸引了大量开发者的关注。今日,LongCat团队宣布推出全新成员——LongCat-Flash-Omni。这款模型在原有基础上实现了多项技术创新,标志着全模态实时交互新时代的到来。

LongCat-Flash-Omni基于LongCat-Flash系列的高效架构设计,采用了最新的Shortcut-Connected MoE(ScMoE)技术,集成了高效的多模态感知模块和语音重建模块。尽管模型总参数达到5600亿(激活参数270亿),仍能提供低延迟的实时音视频交互能力。这一突破为开发者提供了更为高效的多模态应用场景解决方案。

综合评估结果显示,LongCat-Flash-Omni在全模态基准测试中表现出色,达到了开源最先进水平(SOTA)。该模型在文本、图像、视频理解以及语音感知与生成等关键单模态任务中展现了强大的竞争力,实现了“全模态不降智”的目标。

LongCat-Flash-Omni采用了一体化的全模态架构,整合了离线多模态理解和实时音视频交互能力。其设计理念是完全端到端,使用视觉和音频编码器作为多模态感知器,能够直接生成文本和语音token,并通过轻量级音频解码器实现自然语音波形的重建,确保低延迟的实时交互。

此外,该模型引入了渐进式早期多模融合训练策略,以应对全模态模型训练中不同模态数据分布的异质性问题。这一策略确保了各模态间的有效协同,提升了模型的整体性能。

在具体性能测试中,LongCat-Flash-Omni在多个领域表现出色,尤其在文本理解和图像理解任务中,不仅没有出现性能下降,反而实现了显著提升。在音频和视频处理方面,该模型同样表现出色,特别是在实时音视频交互的自然度和流畅度上,领先于许多开源模型。

LongCat团队还为用户提供了新的体验渠道,用户可以通过官网体验图片、文件上传和语音通话功能。同时,LongCat官方App现已上线,支持网络搜索和语音通话,未来还将推出视频通话功能。

Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Flash-Omni

Github: https://github.com/meituan-longcat/LongCat-Flash-Omni

(以上内容均由Ai生成)

你可能还想读

洛克希德马丁引入谷歌云AI能力至本地设施

洛克希德马丁引入谷歌云AI能力至本地设施

快速阅读: 洛克希德·马丁与谷歌合作,利用后者AI工具开发安全解决方案,初期将集成至前者本地环境,涵盖航空航天、太空探索和网络安全等领域。 据两家公司表示,这将使洛克希德·马丁AI工厂团队能够利用谷歌AI工具,为包括航空航天、太空探索和网络 […]

发布时间:2025年11月4日
莫迪将启动1万亿卢比基金,推动私营部门AI与深科技研发

莫迪将启动1万亿卢比基金,推动私营部门AI与深科技研发

快速阅读: 印度总理莫迪将于2025年11月3日宣布1万亿卢比RDI计划,支持私营部门研发,涵盖能源、生物技术等领域,通过长期低息贷款或股权投资形式提供资金,旨在提升印度研发能力。 印度总理莫迪将于2025年11月3日在新德里举行的新兴科学 […]

发布时间:2025年11月4日
阿布扎比国家石油公司与Gecko Robotics合作推进AI和机器人技术

阿布扎比国家石油公司与Gecko Robotics合作推进AI和机器人技术

快速阅读: 阿布扎比国家石油公司通过三项协议加速人工智能技术部署,提高运营效率与安全性,助力阿联酋成为全球能源创新中心。 阿布扎比国家石油公司(ADNOC)董事总经理兼集团首席执行官苏尔坦·艾哈迈德·阿尔·贾贝尔博士表示:“ADNOC正在利 […]

发布时间:2025年11月4日
纳德拉:微软将扩招,但需具备AI实力

纳德拉:微软将扩招,但需具备AI实力

快速阅读: 微软CEO纳德拉宣布将在全球科技行业裁员后增加员工,重点招聘AI人才,以提高生产率和管理效率。此前微软已裁员近4%,投资800亿美元加大AI领域投入。 微软首席执行官萨提亚·纳德拉表示,公司将在全球科技行业裁员潮数月后增加员工人 […]

发布时间:2025年11月4日
韩国启动“双轨”AI战略,加速物理AI发展

韩国启动“双轨”AI战略,加速物理AI发展

快速阅读: 韩国推出“双轨”AI战略,增强文本与物理AI模型竞争力,获英伟达26万GPU支持,目标建立独立物理AI生态系统,推动国家产业升级,确立全球AI领导地位。 韩国正式推出“双轨”人工智能战略,旨在增强在基于文本的基础模型和物理AI模 […]

发布时间:2025年11月4日
星展银行推出AI防骗工具,助力打击购物诈骗

星展银行推出AI防骗工具,助力打击购物诈骗

快速阅读: Starling Bank推出“欺诈智能”工具,利用谷歌Gemini模型分析图片和文本,识别在线购物诈骗,保护用户资金安全,成为英国首个此类服务。 Starling Bank 在其应用程序中推出了一款由人工智能驱动的工具,帮助客 […]

发布时间:2025年11月4日
黄仁勋给出投资者购买英伟达股票的强劲理由

黄仁勋给出投资者购买英伟达股票的强劲理由

快速阅读: 人工智能领域加速增长,“辉煌七巨头”等科技领导者资助确保可持续发展。英伟达预测本世纪末数据中心支出将达4万亿美元,展现巨大投资潜力。 人工智能领域的机遇显然不仅没有减缓,反而可能在加速增长。最吸引人的是,这一领域由“辉煌七巨头” […]

发布时间:2025年11月4日
微软CEO纳德拉宣布扩大员工规模,重点提升AI能力

微软CEO纳德拉宣布扩大员工规模,重点提升AI能力

快速阅读: 微软CEO纳德拉宣布扩大员工队伍,重点发展AI和提高运营效率,新增人力将发挥更大作用,强调适应AI为核心的新工作方式。 微软首席执行官萨提亚·纳德拉宣布了这家科技巨头扩大员工队伍的计划,重点放在人工智能和运营效率上。“我们将会增 […]

发布时间:2025年11月4日