苹果将在 2025 年国际计算机视觉大会上展示多项研究成果,涉及多模态模型、视频生成等
快速阅读: 苹果确认参加2025年10月19日至23日在檀香山举行的ICCV,将展示八篇论文并参与主题演讲。C. Thomas博士出席VISION研讨会并发表演讲,苹果还参与女性研讨会。
苹果公司确认将参加于2025年10月19日至23日在檀香山举行的国际计算机视觉大会(ICCV)。苹果表示,ICCV“每年与欧洲计算机视觉会议(ECCV)交替举办,专注于计算机视觉领域的核心议题”。苹果不仅将在大会上展示被录用的八篇论文,还将参与大会的主题演讲。苹果机器学习应用研究部经理C. Thomas博士将出席第三届基于视觉的工业检测研讨会(VISION),并发表主题演讲,具体题目将在未来几天公布,演讲定于10月19日举行。
苹果将在ICCV 2025上展示的八篇论文包括:
– ETVA:通过细粒度问题生成与回答实现文本到视频对齐的评估
– MM-Spatial:探索多模态大语言模型中的三维空间理解能力
– 原生多模态模型的扩展规律研究
– 稳定扩散模型在视觉上下文学习中表现出隐性优势
– STIV:可扩展的文本与图像条件化视频生成方法
– UINavBench:交互式数字智能体综合评估框架
– 基于多模态提示的统一开放世界分割技术
– UniVG:用于统一图像生成与编辑的通用扩散模型
此外,苹果还将参与“计算机视觉领域女性研讨会”(Women in Computer Vision Workshop)。苹果研究员Patricia Vitoria Carrera与Tanya Glozman将在会后晚宴上担任导师。
文中提及的对外跳转链接(包括但不限于超链接、二维码、口令等形式)旨在提供更多相关信息,节省筛选时间,仅供参考。
(以上内容均由Ai生成)