AI

中山大学联合美团打造X-SAM模型,单次操作可分割多个对象,20项测试全面领先

发布时间:2025年8月19日    来源:szf
中山大学联合美团打造X-SAM模型,单次操作可分割多个对象,20项测试全面领先

快速阅读: 中山大学、鹏城实验室与美团联合发布X-SAM图像分割模型,突破传统SAM技术限制,实现“任意分割”,大幅提升模型适应性和应用范围,有望推动计算机视觉领域快速发展。

中山大学、鹏城实验室与美团三方联合研发的X-SAM图像分割模型近期正式发布,这款多模态大模型在图像分割领域实现了重要突破,将传统的”分割万物”能力升级为”任意分割”,显著提升了模型的适应性和应用范围。

传统的Segment Anything Model(SAM)虽然在生成密集分割掩码方面表现出色,但其只能接受单一视觉提示输入的设计局限性明显。针对这一技术瓶颈,研究团队创新性地提出了视觉定位分割(Visual Grounded Segmentation, VGS)任务框架,通过交互式视觉提示实现对所有实例对象的精确分割,为多模态大语言模型提供了像素级的理解能力。

X-SAM的技术架构采用了多项创新设计。模型支持统一的输入格式和输出表示,能够处理多种类型的视觉和文本查询输入。其核心的双编码器架构确保了对图像内容和分割特征的深度理解,而分割连接器则提供多尺度信息融合,大幅提升分割精度。

最值得关注的是,X-SAM集成了 最新 的Mask2Former架构作为分割解码器,这使得模型能够在单次操作中同时分割多个目标对象,彻底突破了传统SAM只能处理单一对象的技术限制。这一改进不仅提高了处理效率,也为复杂场景下的批量分割任务提供了可能。

在模型训练方面,研究团队采用了三阶段渐进式训练策略,通过逐步增强的学习过程确保模型性能的稳定提升。经过在20多个主流分割数据集上的全面测试,X-SAM在对话生成分割任务和图文理解任务中均取得了领先的性能表现,验证了其技术方案的有效性。

X-SAM的发布为图像分割技术发展指明了新方向,也为构建更加智能的通用视觉理解系统提供了重要的技术基础。研究团队表示,下一步将重点探索该技术在视频领域的应用拓展,推动图像与视频分割技术的统一化发展,进一步提升机器视觉理解能力的边界。

这项研究成果不仅在学术层面具有重要意义,其在自动驾驶、医疗影像、工业检测等实际应用场景中的潜力也值得期待。随着模型开源和技术推广,预计将推动整个计算机视觉领域的快速发展。

论文地址:https://arxiv.org/pdf/2508.04655 代码地址:https://github.com/wanghao9610/X-SAM Demo地址: https://47.115.200.157:7861

(以上内容均由Ai生成)

你可能还想读

软银收购DigitalBridge加码AI算力布局

软银收购DigitalBridge加码AI算力布局

快速阅读: 据彭博社报道,美国数字桥公司加速布局亚太数字基建,整合通信塔与数据中心资源,以满足AI算力激增带来的低延迟、高带宽需求,强化其全球基础设施地位。 近日,美国数字桥公司(DigitalBridge)在拓展亚洲数字基础设施布局方面动 […]

发布时间:2025年12月8日
贝莱德:AI投资将驱动美国经济韧性增长

贝莱德:AI投资将驱动美国经济韧性增长

快速阅读: 据贝莱德发布消息称,美国经济正迈入由大规模人工智能投资驱动的资本密集型阶段,预计2030年全球AI相关资本支出将达5至8万亿美元,重塑产业格局并影响供应链与劳动力市场。 日前,全球知名资产管理公司贝莱德在其最新发布的全球经济展望 […]

发布时间:2025年12月8日
硅谷预言:AI将重塑工作与收入

硅谷预言:AI将重塑工作与收入

快速阅读: 据最新消息,人工智能加速冲击全球就业结构,部分职业或将消失,肯尼亚试点全民基本收入项目引发隐私争议,国际社会呼吁构建适应AI时代的社会保障政策框架。 近日,人工智能技术加速渗透全球多个行业,引发对就业结构和收入模式的广泛关注。多 […]

发布时间:2025年12月8日
AI重塑广告业:从执行到智能协同

AI重塑广告业:从执行到智能协同

快速阅读: 据最新消息,广告传播机构加速转型为智能协同伙伴,依托AI优化创意系统,融合算法效率与人文共情,构建“智能+共情”双轮驱动战略,提升传播精准度与内容温度。 人工智能正加速从实验室走向实际应用,其价值日益体现在广告、媒体等行业的日常 […]

发布时间:2025年12月8日
AI推动数据分析普及,渠道伙伴机遇扩大

AI推动数据分析普及,渠道伙伴机遇扩大

快速阅读: 据最新消息,Tableau首席产品官指出AI正推动数据分析进入新阶段,聚焦对话式分析、实时洞察与语义层技术三大方向,2025年成AI应用部署关键年。 日前,数据分析企业Tableau首席产品官索南德·琼斯表示,随着人工智能技术加 […]

发布时间:2025年12月8日
欧盟报告:AI训练应借鉴Napster版权教训

欧盟报告:AI训练应借鉴Napster版权教训

快速阅读: 欧洲议会法律事务委员会发布报告,主张通过强制性法定许可制度解决AI训练数据版权争议,允许使用公开作品并支付统一版税,以平衡创新激励与权利人补偿,避免“选择退出”机制导致模型偏见。 日前,欧洲议会法律事务委员会发布题为《版权与人工 […]

发布时间:2025年12月8日
特朗普推AI新政,各州监管加速推进

特朗普推AI新政,各州监管加速推进

快速阅读: 据最新消息,美国科罗拉多、加州和纽约等州加速推进AI监管立法,分别聚焦算法歧视、高风险系统披露及自动化决策监管,但行业担忧各州标准不一或阻碍全国AI产业发展。 近日,美国多个州加快人工智能监管立法步伐,以应对算法偏见、数据隐私及 […]

发布时间:2025年12月8日
塔塔与英特尔携手布局半导体与AI

塔塔与英特尔携手布局半导体与AI

快速阅读: 12月8日消息,印度塔塔集团与英特尔达成战略合作,将共同推进半导体制造、封装测试及AI计算在印发展,强化本土产业链并把握人工智能市场机遇。 今日,印度塔塔集团与英特尔公司宣布达成战略合作,双方将共同推进半导体及系统制造、封装测试 […]

发布时间:2025年12月8日