火山引擎优化Prometheus,助力大模型场景稳定高效
快速阅读: QCon全球软件开发大会将于10月23日至25日在上海举办,聚焦AI技术实践与创新,涵盖Agentic AI、多模态融合、混沌工程等20多个专题,百位技术专家分享前沿洞察。
如果你也关注Agent、AI搜索、多模态、工程化等话题,一定不要错过这100+可落地的实践案例! 10月23日-10月25日, QCon全球软件开发大会 “将在上海举办。本次大会将聚焦Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及AI时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界! 字节跳动研发工程师郭刚平已确认出席并发表题为《 火山引擎 Prometheus 面向大模型场景的优化实践 “》的主题分享。近年来,AI 技术发展迅猛,相关产品和解决方案已深入社会经济的方方面面,成为驱动创新、提升效率的重要引擎,AI 应用的其可观测技术也成为了行业关注的一个焦点,Prometheus 作为云原生监控领域事实标准,被广泛应用于 AI 大模型和智能驾驶领域的可观测任务,用于实现最佳性能及减少故障。本次演讲将分享火山引擎托管 Prometheus 在服务 AI 领域客户(如火山方舟)过程中,积累的保障 AI 推理服务时序数据库稳定性的关键技术实践,希望能给听众带来一些启发和思考。
郭刚平,字节跳动基础架构可观测团队研发工程师,多年可观测领域从业经验,在可观测系统架构设计、大规模数据链路性能优化、稳定性保障方面有比较多的实践经验,现任火山引擎托管 Prometheus 产品研发负责人。他在本次会议的详细演讲内容如下: 演讲提纲 1. 大模型场景指标观测需求和挑战 推理训练场景指标大规模高基数问题方舟大量接入点带来十亿级别的时序基数自动驾驶云大量短时训练任务引起高基数单指标高基数导致大查询在线推理服务扩缩容调度需求流量高峰需要快速扩容对查询可用性的要求K8s 基础的 HPA 不满足要求,需要基于 GPU 等自定义指标来作为扩缩容依据推理服务流量亲和性调度对指标实时性的要求大流量租户 Qos 保障需求写入链路网关共享集群导致的租户间写入相互影响查询链路单一租户大查询影响同一集群下的其他租户可用性 2. 新时代下 Prometheus 核心演进思路 端到端稳定性保障集群粒度、租户粒度、查询粒度写入水平扩展、统一聚合查询,支撑大规模数据量原地数据分析 & AIOps 数据探查大规模场景下大模型的监控架构 3. 火山引擎托管 Prometheus 优化实践 高基数问题高流失率高基数时序场景下的短时查询优化查询预聚合降低基数与业务侧对齐打点最佳实践方案在线推理调度对指标可用性&实时性的需求近用户集群侧实时指标缓存大流量租户 Qos 保障写入链路大流量租户网关自动拆分独立分组查询链路大查询发现和治理面向” Never OOM “的查询组件设计Shuffle Sharding 查询聚合工作区 突破单集群规模上限Sharding 写入 & 聚合查询 4. 大模型场景实战效果 稳定支撑火山引擎方舟十亿级时序读写,实现业务零改造低成本水平扩展近集群侧实时指标,助力在线推理服务 TTFT 延迟降低 40% 5. 未来与展望 更高性能、更低成本的下一代时序存储Inplace 时序数据分析能力AIOps 能力内外复用上云 实践痛点 时序的高基数问题是个持续易反复的问题,因为生产端是不受控的,如何在保障系统稳定性的前提下尽最大努力保障用户的可用性和体验是一个持久战,不仅仅是技术层面,也需要用户侧的宣贯和配套的基础建设来减少不合理使用姿势 听众受益 了解端到端构建稳定的监控方案了解大规模场景下大模型的监控架构实践了解 Prometheus 创新性技术落地 除此之外,本次大会还策划了 多模态融合技术与创新应用 “、 混沌工程与全链路压测实践 “、 Data Infra for AI “、 Agentic AI “、 加速与反哺:AI 时代的可观测实践 “、 Vibe Coding “、 端侧大模型的创新与应用 “、 大模型推理的工程实践 “、 AI 搜索技术的深水区 “、 模型训练与微调 “、 具身智能:当 AI 学会“动手思考” “、 大模型驱动的制造革命 “、 AI4SE:软件研发提质增效实践 “、 AI 重塑视觉创作体验 “、 从“炫技”走向“实用”的 AI 产品 “、 大模型驱动的智能数据分析 “等20多个专题论坛,届时将有来自不同行业、不同领域、不同企业的100+资深专家在QCon上海站现场带来前沿技术洞察和一线实践经验。
现在报名即可以享受 9 折优惠,单张门票立省 680 元,,详情可联系票务经理 18514549229 咨询。
(以上内容均由Ai生成)