Meta发布SAM Audio支持点击分离声音

发布时间:2025年12月18日    来源:szf
Meta发布SAM Audio支持点击分离声音

快速阅读: 据Meta消息,该公司近日推出全球首个统一多模态音频分离模型SAM Audio,支持通过文本、视觉或时间提示精准提取目标声音。其自研感知编码器PE-AV实现视听深度融合,并同步开源评测基准与自动评估工具,将赋能字幕生成、AR交互及无障碍设备等应用。

Meta近日正式推出全球首个统一的多模态音频分离模型SAM Audio,标志着音频处理技术迈入可交互、可编辑、可理解的新阶段。该模型支持用户通过直观方式,从混杂的音视频中精准提取目标声音。

SAM Audio首次将人类自然感知声音的方式——看、说、指、选——完整融入AI系统。用户可在视频中点击吉他手以分离纯净吉他声,输入“狗吠”即可过滤播客中的犬吠噪音,或圈定特定时间段(如3分12秒至3分18秒),自动剔除整段录音中的同类干扰音。

其核心为自研的感知编码器视听(PE-AV),被Meta称为模型的“耳朵”。该引擎基于今年4月开源的Meta Perception Encoder计算机视觉模型扩展而来,首次实现高级视觉理解与音频信号的深度融合,支持跨模态声音定位与分离。

模型提供三种交互方式:文本提示(如“人声演唱”)、视觉提示(点击画面中的发声物体)和时间片段提示(行业首创)。三者可单独或组合使用,大幅提升操作灵活性与精度。

为推动技术标准化,Meta同步开源两大工具:SAM Audio-Bench——首个基于真实场景的音频分离评测基准;以及SAM Audio Judge——全球首个专用于音频分离质量的自动评估模型,可量化判断结果的纯净度与完整性。

作为底层引擎,PE-AV还将赋能Meta旗下字幕生成、视频理解与智能剪辑等AI产品。其开源有望助力开发者构建“视听联觉”应用,涵盖自动消噪会议记录、沉浸式AR音频交互及无障碍听觉辅助设备等领域。

(以上内容均由Ai生成)

引用自:AIbase人工智能资讯平台

你可能还想读

中国AI芯片新贵崛起

中国AI芯片新贵崛起

快速阅读: 据彭博亿万富豪指数报道,受美国芯片出口管制及国产大模型推动,中国AI芯片企业密集上市造富,沐曦、摩尔线程等公司创始人身家跃升至数十亿美元,但新锐富豪财富仍远低于钟睒睒、马化腾等传统巨头。 中国房地产市场持续调整,部分传统富豪财富 […]

发布时间:2025年12月18日
48%制造企业用AI提升产出效率

48%制造企业用AI提升产出效率

快速阅读: 据PYMNTS Intelligence报告显示,60家制造、服务与科技企业正应对AI对工作模式的重塑:48%的制造企业聚焦提效,30%的服务企业优化决策,75%的科技公司自认已做好准备。半数企业将设立高阶新岗,技能缺口与运营复 […]

发布时间:2025年12月18日
Warhorse工作室回应Larian使用AI争议

Warhorse工作室回应Larian使用AI争议

快速阅读: 据彭博社报道,Warhorse Studios联合创始人丹尼尔·瓦夫拉呼吁理性看待AI在游戏开发中的应用,称其适用于非核心重复任务以提升效率,但强调《天国:拯救2》未使用AI创作内容,仅用于画质增强,并指出技术变革不可逆,行业应 […]

发布时间:2025年12月18日
Avnet Silica携手DeepX推边缘AI解决方案

Avnet Silica携手DeepX推边缘AI解决方案

快速阅读: 据安富利旗下Silica公司消息,该公司近日与DeepX达成合作,以满足欧洲、中东和非洲地区对高性能、超低功耗边缘AI解决方案的迫切需求。相关技术方案现已面向EMEA客户推出,重点应用于智慧城市、智能制造、自主移动机器人及机器视 […]

发布时间:2025年12月18日
OpenAI计划融资百亿美元估值达7500亿

OpenAI计划融资百亿美元估值达7500亿

快速阅读: 据The Information报道,OpenAI正与投资者磋商新一轮融资,计划募资最多1000亿美元,估值或达7500亿美元,为其2026年下半年潜在IPO铺路。资金将主要用于算力基础设施建设,亚马逊也在洽谈投资100亿美元, […]

发布时间:2025年12月18日
AI自动关停客户账户引发治理风险

AI自动关停客户账户引发治理风险

快速阅读: 据相关报道,Greyhound Research分析师戈吉亚警示,云与AI服务商“静默关停”企业账户正成为新型治理风险,主要源于自动化系统与合同自由裁量权。他指出,全球47%的首席信息官缺乏应对此类突发中断的预案,呼吁企业完善多 […]

发布时间:2025年12月18日
韩国政府2月起向机构分发英伟达GPU

韩国政府2月起向机构分发英伟达GPU

快速阅读: 据韩国科学和信息通信技术部消息,韩国将于2026年2月起分批发放英伟达GPU,支持企业、高校及国家级AI项目,推动国产NPU研发与6G网络建设,目标到2030年构建能效超进口GPU两倍的AI服务器生态,并在全球6G市场占据20% […]

发布时间:2025年12月18日
医院实施人工智能需建立统一标准

医院实施人工智能需建立统一标准

快速阅读: 据美国食品药品监督管理局消息,该机构正推动将特定人工智能软件作为医疗器械纳入上市前审批,以加强医疗AI的安全监管;同时,独立认证机构URAC于2025年推出首个医疗人工智能认证项目,通过全生命周期评估提升工具的公平性、透明度与临 […]

发布时间:2025年12月18日