商汤副总监龚睿昊确认出席AICon北京站,分享大模型推理系统与压缩优化

发布时间:2025年11月3日    来源:szf
商汤副总监龚睿昊确认出席AICon北京站,分享大模型推理系统与压缩优化

快速阅读: 12月19-20日,AICon全球人工智能大会在北京举行,主题为“探索AI应用边界”。大会聚焦企业级Agent落地、上下文工程等,商汤副总监龚睿昊将分享大模型推理优化与边缘AI部署的实践经验。

12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站 “将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径! 商汤副总监龚睿昊已确认出席并将在「 大模型推理优化与边缘 AI 部署 “」专题发表题为《 大模型推理系统与压缩优化:从算法到工具的工程实践 “》的主题分享。大模型时代的模型生产成本更加高昂,模型尺寸大、并行规模大、服务并发高,体系化的大模型工具链和系统对于提升模型迭代和研发效率至关重要。

本次演讲将分享在大模型工具和系统建设的实践经验,介绍搭建的大模型训练、压缩和推理部署系列工具,覆盖多种模态和场景,通过分析阐述其中的相关算法创新与系统实现原理,汇报团队在多种模态大模型的训练系统优化、模型压缩算法和大规模并行服务上的系列探索。

龚睿昊是商汤科技研究院大模型工具体系团队负责人,主要负责工业级模型工具链,包括大规模模型训练、多平台部署、模型压缩和软硬件协同技术体系。通过算法和工具实现规模化工业落地,支持智慧城市、智能驾驶、AIOT、手机场景等大量业务模型的模型生产,团队支撑了商量等商汤大模型体系的底层技术搭建,致力于 ML+System 的综合效率提升。在 ICLR、NeuIPS、CVPR、ICCV、IJCV 等期刊会议发表四十余篇论文,多次获得低功耗计算机视觉比赛 LPCV 冠军、无人机追逐赛亚军等奖项。他在本次会议的详细演讲内容如下: 1. 引言: ○ 视频、图像、语音、语言多种模态生成式大模型推理的系统挑战 ○ Light系列推理工具生态2. 核心技术解析: ○ 多进程架构:模态伸缩与扩展 ○ 多维度压缩方法:量化、Token Pruning、稀疏和Cache复用 ○ 动态扩缩容:大规模服务的实时弹性扩缩容设计 ○ Triton算子:全面灵活的算子库3. 应用案例 ○ 视频生成民主化:个人玩家的福音 ○ 规模服务的降本:组合拳的成本控制4. 未来展望: ○ 统一模态的融合设计 ○ 应用层的系统打通听众收益:○ 快速了解生成式大模型的核心推理优化技术,掌握各种模态类型的优化异同点,并理解领域发展的最新趋势 除此之外,本次大会还策划了 LLM 时代的软件研发新范式 “、 Context Engineering “、 Data+AI / Agent 落地实践 “、 大模型系统工程 “、 企业级 Agent 的设计与落地 “、 大模型时代下的搜广推系统实践 “、 多模态从技术突破到创新应用落地 “等10多个专题论坛,届时将有来自不同行业、不同领域、不同企业的50+资深专家在AICon北京站现场带来前沿技术洞察和一线实践经验。

现在报名即可以享受 8 折优惠,单张门票立省1160 元,详情可扫码或联系票务经理 13269078023 咨询。

(以上内容均由Ai生成)

你可能还想读

MSP平台整合缓解业务增长压力

MSP平台整合缓解业务增长压力

快速阅读: 截至今日,全球托管服务提供商(MSP)在IT管理复杂化与成本压力下,正加速采用一体化平台整合分散工具,以提升运维效率、强化安全防护,并通过多租户架构、模块化设计及原生AI功能实现差异化竞争与业务可持续增长。 随着企业IT架构日益 […]

发布时间:2025年12月19日
3D打印定制鞋精准适配双脚差异

3D打印定制鞋精准适配双脚差异

快速阅读: 截至本周,Zellerfeld公司推出售价190美元的3D打印定制运动鞋,依托AI设计与足部扫描实现高度贴合,采用一体成型Zellerfoam材料支持小批量生产。尽管交付周期约为25至35天,且家庭打印尚难匹敌专业品控,但该模式 […]

发布时间:2025年12月19日
Edison Scientific融资7000万美元推进自主AI科研平台

Edison Scientific融资7000万美元推进自主AI科研平台

快速阅读: 据爱迪生科学公司消息,该公司近日完成7000万美元融资,将用于扩大运营并研发其“宇宙”AI科研平台。该平台可自动完成文献综述、数据分析与实验规划等任务,显著缩短药物研发等领域的科研周期。 美国旧金山人工智能初创企业爱迪生科学公司 […]

发布时间:2025年12月19日
海信推模块化AI家电解决用户痛点

海信推模块化AI家电解决用户痛点

快速阅读: 据机构披露,海信在2025年CES上推出多款智能家电新品,聚焦真实生活痛点,包括顶部排水除湿机、模块化洗烘系统及AI联动厨房套系,依托“Connect Life”生态实现跨设备协同与场景化服务。产品将于1月6日起在拉斯维加斯展会 […]

发布时间:2025年12月19日
Info-Tech发布2025年顶级机器学习平台报告

Info-Tech发布2025年顶级机器学习平台报告

快速阅读: 据Info-Tech Research Group发布的报告,该机构基于682份用户评价评选出2025年四大机器学习平台:Databricks以95分居首,Azure Machine Learning与Google Cloud […]

发布时间:2025年12月19日
特朗普全球布局AI与关键矿产供应链

特朗普全球布局AI与关键矿产供应链

快速阅读: 据美国国际发展金融公司消息,该公司近日签署5.53亿美元贷款协议,用于翻新非洲洛比托—大西洋铁路,以提升刚果(金)和赞比亚关键矿产的运输能力。项目完成后年运力将达460万吨,物流成本降低30%,有助于强化美国在稀土等战略资源供应 […]

发布时间:2025年12月19日
DuckDuckGo上线AI图像生成功能

DuckDuckGo上线AI图像生成功能

快速阅读: 据DuckDuckGo消息,该公司近日上线测试版图像生成工具Duck.ai,延续隐私优先原则,用户提示内容经匿名化处理且不用于训练模型,生成图片仅存于本地并嵌入C2PA元数据,非订阅用户每日使用受限。 DuckDuckGo近日推 […]

发布时间:2025年12月19日
Cloudia Research获批150万欧元债券推进AI软件开发

Cloudia Research获批150万欧元债券推进AI软件开发

快速阅读: 据机构披露,Cloudia Research公司获批发行150万欧元七年期债券,面向合格投资者定向募集,融资所得将用于支持其人工智能软件开发及中长期战略。该交易属于“伦巴第篮子债券”计划,预计于2026年1月底前完成。 Clou […]

发布时间:2025年12月19日