美团发布“全能猫”多模态大模型,实时交互无延迟

发布时间:2025年11月5日    来源:szf
美团发布“全能猫”多模态大模型,实时交互无延迟

快速阅读: 美团推出全新开源大模型LongCat-Flash-Omni,实现多模态实时处理与零延迟交互,涵盖文本、语音、图像、视频,性能超越多个闭源竞品,推动多模态AI发展。

当业界还在争论多模态AI能否真正落地,美团已悄然甩出一张 王牌 ——全新开源大模型 LongCat-Flash-Omni 正式上线,并在多项基准测试中超越多个闭源竞品,实现“开源即SOTA”(State-of-the-Art)的罕见突破。这款名字中暗含“全能”之意的AI系统,不仅支持文本、语音、图像、视频的实时融合处理,更以近乎零延迟的交互体验,将本地化多模态智能推向新高度。

LongCat-Flash-Omni的惊艳之处,在于其对复杂跨模态任务的精准掌控。实测显示,面对“描述一个小球在六边形空间内的运动轨迹”这类融合物理逻辑与空间推理的问题,模型不仅能准确建模,还能用自然语言清晰解释动力学过程。在语音识别方面,即便在高噪声环境下,它仍能精准提取语义;面对模糊图像或短视频片段,也能快速定位关键信息并生成结构化回答。

这一切得益于其创新的端到端统一架构。不同于传统多模态模型将各模态分支独立处理再拼接,LongCat采用深度融合设计,让文本、音频、视觉数据在统一表征空间中对齐与推理。训练过程中,团队采用渐进式多模态注入策略——先夯实语言基础,再逐步引入图像、语音、视频数据,使模型在保持语言能力的同时,稳步提升跨模态泛化性能。

更令人意外的是其 极致 优化的响应速度。得益于Flash推理引擎与轻量化设计,LongCat-Flash-Omni在普通消费级GPU上即可实现流畅对话,用户在美团官方LongCat APP或网页端体验时,几乎感受不到输入与回复之间的延迟,真正实现“所问即所得”的自然交互。

目前,该模型已在美团旗下平台免费开放,开发者可通过Hugging Face获取权重,普通用户则可直接在应用内试用。这一举动不仅彰显美团在AI底层技术上的自信,也释放出推动国产多模态生态发展的明确信号。

在AI竞争从“单模态精度”转向“多模态协同”的关键节点,LongCat-Flash-Omni的出现,既是对技术边界的突破,也是对应用场景的重新定义。当外卖平台都能训练出比肩国际巨头的多模态大模型,中国AI的下半场,或许才刚刚开始。

(以上内容均由Ai生成)

你可能还想读

Anthropic推出新代码执行模式,大幅提升AI效率

Anthropic推出新代码执行模式,大幅提升AI效率

快速阅读: Anthropic推出基于MCP的代码执行模式,使AI Agent能高效调用工具,减少99%上下文占用,提升数据隐私安全,增强系统性能与可维护性。 近日,Anthropic 在其 最新 发布中介绍了基于 Model Contex […]

发布时间:2025年11月5日
小鹏汽车重磅发布第二代 VLA:颠覆传统,开创智能驾驶新时代

小鹏汽车重磅发布第二代 VLA:颠覆传统,开创智能驾驶新时代

快速阅读: 小鹏汽车在2025科技日推出第二代VLA模型,实现从视觉信号直接到动作指令的端到端输出,参数量达数十亿级,远超行业水平,助力智能驾驶等领域发展。 在2025小鹏科技日盛会上,小鹏汽车推出了其第二代VLA(视觉-语言-动作)模型, […]

发布时间:2025年11月5日
王兴兴:今年智能机器人产业平均增速应有100%,想全球领先要实现两个80%

王兴兴:今年智能机器人产业平均增速应有100%,想全球领先要实现两个80%

快速阅读: 宇树科技创始人王兴兴在第八届虹桥国际经济论坛上表示,中国工业机器人出口增长超51%,智能机器人产业有望实现100%增长。宇树的第二款人形机器人G1广受好评,第三款R1预计2026年成全球出货量最多的小型人形机器人。 王兴兴在论坛 […]

发布时间:2025年11月5日
字节火山引擎启动高薪招聘,实质性进军“人形具身机器人”赛道

字节火山引擎启动高薪招聘,实质性进军“人形具身机器人”赛道

快速阅读: 字节跳动旗下火山引擎团队高薪招聘具身智能专家,月薪9.5万至12万,聚焦人形具身机器人研发,展现其在AI硬件领域的雄心。 科技巨头字节跳动正以高薪姿态实质性发力最前沿的 人形具身机器人 赛道。近日,字节跳动旗下 火山引擎团队 启 […]

发布时间:2025年11月5日
网易云音乐正式推出大模型音效“AI调音大师”

网易云音乐正式推出大模型音效“AI调音大师”

快速阅读: 网易云音乐推出“AI调音大师”,利用AI技术动态解析歌曲特征,提供个性化音效调节,支持实时音效波谱显示及多维度调音选项,提升用户体验。 网易云音乐正式推出了一项全新的音效功能 ——“AI 调音大师”。用户只需在网易云音乐中搜索 […]

发布时间:2025年11月5日
双11购物新助手上线!飞猪AI助你精准选品、轻松预订

双11购物新助手上线!飞猪AI助你精准选品、轻松预订

快速阅读: 飞猪AI“问一问”团队推出双11选品助手,精准推荐机票、酒店套餐等,覆盖周末及节假日不加价,简化消费者决策过程,提升购物体验。 随着双11购物节的临近,消费者们在海量的活动商品中往往会感到眼花缭乱。为了帮助用户在这个疯狂的购物季 […]

发布时间:2025年11月5日
上线4个月,月活用户破千万,AQ成中国第一行业专业级AI应用

上线4个月,月活用户破千万,AQ成中国第一行业专业级AI应用

快速阅读: 蚂蚁集团AI健康应用AQ自4月上线以来,月活跃用户突破千万,成为第五个达到此里程碑的AI原生应用,且是唯一专业级。其复合增长率83.4%,远超行业平均,预示AI医疗健康领域快速增长。 蚂蚁集团的AI医疗健康业务正在全面加速发展。 […]

发布时间:2025年11月5日
马斯克秘密实验室:收集人类行为数据以训练机器人

马斯克秘密实验室:收集人类行为数据以训练机器人

快速阅读: 特斯拉在加州的秘密实验室通过数据收集者执行日常任务,记录人类行为,以训练优化型机器人Optimus。马斯克计划年底生产5000台,但当前演示效果不佳,需远程操控辅助。 根据《 Business Insider 》的 最新 报道, […]

发布时间:2025年11月5日