点击分离 – 数智风暴

Meta发布SAM Audio支持点击分离声音

快速阅读: 据Meta消息，该公司近日推出全球首个统一多模态音频分离模型SAM Audio，支持通过文本、视觉或时间提示精准提取目标声音。其自研感知编码器PE-AV实现视听深度融合，并同步开源评测基准与自动评估工具，将赋能字幕生成、AR交互 […]

发布时间：2025-12-18 15:57 来源：szf