为 Ray-Ban Meta 眼镜构建多模态 AI
快速阅读: 据《Facebook 工程》最新报道,在本期《元技术播客》中,我们结识了尚恩,他在脸书公司担任研究科学家,专注于为可穿戴设备研究计算机视觉和多模态人工智能已有七年之久。他和他的团队正在开展尖端的人工智能研究,如“AnyMod”模型,该模型能处理包括文本、音频、视频及IMU运动传感器数据在内的多种输入信号。
在本期《元技术播客》中,来认识一下尚恩,他在脸书公司工作,是一位在过去七年里一直专注于为可穿戴设备研究计算机视觉和多模态人工智能的研究科学家。尚恩和他的团队一直在进行尖端的人工智能研究,例如“任何动物”,这是一种能够处理多种输入信号的统一语言模型,包括文本、音频、视频以及IMU运动传感器数据在内的多种输入信号。
(以上内容均由Ai生成)