上海AI Lab青年科学家王泰:大规模具身多模态三维感知 演讲预告
12月5-6日,2024中国生成式AI大会(上海站)“GenAICon2024”将在上海中星铂尔曼大酒店盛大举办。中国生成式AI大会已成功举办两届,迅速成长为国内生成式AI领域最具影响力的产业峰会之一。
此次也是中国生成式AI大会首次登陆上海举办,由智一科技旗下智能产业第一媒体智东西、AI与硬科技知识分享社区智猩猩共同发起。本次大会的指导单位是上海市人工智能行业协会。
大会上海站将设置”主会场峰会+分会场研讨会+展览区”。主会场将进行大模型峰会、AIInfra峰会,分会场将组织端侧生成式AI、AI视频生成和具身智能三场技术研讨会。主会场与分会场外则设有展览区。
上海站以”智能跃进创造无限”为主题,将邀请50+位嘉宾带来致辞、演讲、报告和对话讨论,以前瞻性视角为大家解构和把脉生成式AI的技术产品创新、商业落地解法、未来趋势走向与前沿研究焦点。
在分会场次日下午进行的具身智能技术研讨会上,上海人工智能实验室青年科学家王泰博士将带来报告,主题为《大规模具身多模态三维感知》。
嘉宾介绍
王泰博士毕业于香港中文大学MMLab,研究方向为具身智能和三维视觉。过往工作有近三十篇论文在顶级会议和期刊上发表,谷歌学术引用2900余次,多篇被选中做口头报告或获得满分评审,并多次在国际顶级竞赛中获得冠军。代表工作包括早期FCOS3D系列工作和近期EmbodiedScan,GRUtopia和PointLLM等,相关开源工作如MMDetection3D在学界和业界有广泛影响。曾获得ECCV最佳论文提名、ICCV研讨会最佳论文、港府奖学金。
报告概要
近年来,大模型的成功以及模仿学习、强化学习等方法的突破持续推动着具身智能的快速发展。但这一领域仍然面临着数据匮乏的核心问题,大规模训练和评测仍存在客观瓶颈。生成式AI的进展为解决这一问题提供了重要路径。
本报告将聚焦于三维场景中具身多模态感知相关的具体任务,详细介绍团队利用多模态大模型的生成能力设计三维多模态数据的自动化标注管线,从而形成大规模三维物体、场景在不同粒度全方位的语料标注,构建带有显式三维建模和空间感知能力的具身感知基础模型,并最终利用大模型实现更符合人类判断的自动化评测。最后,报告将展望生成式AI在机器人交互数据方面的巨大潜力,同时探讨其潜在的局限性。
大会部分嘉宾及日程
报名方式
具身智能技术研讨会是大会上海站的三场研讨会之一,将在分会场第二日下午进行。
研讨会主要向购买大会通票、贵宾票的用户,以及定向邀请的用户开放。
希望参加研讨会的朋友,可以扫描下方二维码,添加小助手”泡泡”咨询和购票。已添加过”泡泡”的老朋友,给”泡泡”私信,发送”GenAI24″即可。
除了通票、贵宾票,大会还设有免费票(需经主办方审核),可参加除分会场研讨会之外的主会场会议“大模型峰会”和“AIInfra峰会”,有需要的朋友可以进行申请。