AI

火山引擎优化Prometheus,助力大模型场景稳定高效

发布时间:2025年9月12日    来源:szf
火山引擎优化Prometheus,助力大模型场景稳定高效

快速阅读: QCon全球软件开发大会将于10月23日至25日在上海举办,聚焦AI技术实践与创新,涵盖Agentic AI、多模态融合、混沌工程等20多个专题,百位技术专家分享前沿洞察。

如果你也关注Agent、AI搜索、多模态、工程化等话题,一定不要错过这100+可落地的实践案例! 10月23日-10月25日, QCon全球软件开发大会 “将在上海举办。本次大会将聚焦Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及AI时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界! 字节跳动研发工程师郭刚平已确认出席并发表题为《 火山引擎 Prometheus 面向大模型场景的优化实践 “》的主题分享。近年来,AI 技术发展迅猛,相关产品和解决方案已深入社会经济的方方面面,成为驱动创新、提升效率的重要引擎,AI 应用的其可观测技术也成为了行业关注的一个焦点,Prometheus 作为云原生监控领域事实标准,被广泛应用于 AI 大模型和智能驾驶领域的可观测任务,用于实现最佳性能及减少故障。本次演讲将分享火山引擎托管 Prometheus 在服务 AI 领域客户(如火山方舟)过程中,积累的保障 AI 推理服务时序数据库稳定性的关键技术实践,希望能给听众带来一些启发和思考。

郭刚平,字节跳动基础架构可观测团队研发工程师,多年可观测领域从业经验,在可观测系统架构设计、大规模数据链路性能优化、稳定性保障方面有比较多的实践经验,现任火山引擎托管 Prometheus 产品研发负责人。他在本次会议的详细演讲内容如下: 演讲提纲 1. 大模型场景指标观测需求和挑战 推理训练场景指标大规模高基数问题方舟大量接入点带来十亿级别的时序基数自动驾驶云大量短时训练任务引起高基数单指标高基数导致大查询在线推理服务扩缩容调度需求流量高峰需要快速扩容对查询可用性的要求K8s 基础的 HPA 不满足要求,需要基于 GPU 等自定义指标来作为扩缩容依据推理服务流量亲和性调度对指标实时性的要求大流量租户 Qos 保障需求写入链路网关共享集群导致的租户间写入相互影响查询链路单一租户大查询影响同一集群下的其他租户可用性 2. 新时代下 Prometheus 核心演进思路 端到端稳定性保障集群粒度、租户粒度、查询粒度写入水平扩展、统一聚合查询,支撑大规模数据量原地数据分析 & AIOps 数据探查大规模场景下大模型的监控架构 3. 火山引擎托管 Prometheus 优化实践 高基数问题高流失率高基数时序场景下的短时查询优化查询预聚合降低基数与业务侧对齐打点最佳实践方案在线推理调度对指标可用性&实时性的需求近用户集群侧实时指标缓存大流量租户 Qos 保障写入链路大流量租户网关自动拆分独立分组查询链路大查询发现和治理面向” Never OOM “的查询组件设计Shuffle Sharding 查询聚合工作区 突破单集群规模上限Sharding 写入 & 聚合查询 4. 大模型场景实战效果 稳定支撑火山引擎方舟十亿级时序读写,实现业务零改造低成本水平扩展近集群侧实时指标,助力在线推理服务 TTFT 延迟降低 40% 5. 未来与展望 更高性能、更低成本的下一代时序存储Inplace 时序数据分析能力AIOps 能力内外复用上云 实践痛点 时序的高基数问题是个持续易反复的问题,因为生产端是不受控的,如何在保障系统稳定性的前提下尽最大努力保障用户的可用性和体验是一个持久战,不仅仅是技术层面,也需要用户侧的宣贯和配套的基础建设来减少不合理使用姿势 听众受益 了解端到端构建稳定的监控方案了解大规模场景下大模型的监控架构实践了解 Prometheus 创新性技术落地 除此之外,本次大会还策划了 多模态融合技术与创新应用 “、 混沌工程与全链路压测实践 “、 Data Infra for AI “、 Agentic AI “、 加速与反哺:AI 时代的可观测实践 “、 Vibe Coding “、 端侧大模型的创新与应用 “、 大模型推理的工程实践 “、 AI 搜索技术的深水区 “、 模型训练与微调 “、 具身智能:当 AI 学会“动手思考” “、 大模型驱动的制造革命 “、 AI4SE:软件研发提质增效实践 “、 AI 重塑视觉创作体验 “、 从“炫技”走向“实用”的 AI 产品 “、 大模型驱动的智能数据分析 “等20多个专题论坛,届时将有来自不同行业、不同领域、不同企业的100+资深专家在QCon上海站现场带来前沿技术洞察和一线实践经验。

现在报名即可以享受 9 折优惠,单张门票立省 680 元,,详情可联系票务经理 18514549229 咨询。

(以上内容均由Ai生成)

你可能还想读

TCS推AI机器狗进军航空业

TCS推AI机器狗进军航空业

快速阅读: 据印度塔塔咨询服务公司(TCS)发布消息称,全球航空航天业加速绿色智能化转型,40%企业预计五年内实现“熄灯工厂”,数字孪生与eVTOL成重点方向,物理AI机器人有望获批用于高危场景。 日前,全球航空航天产业加速向绿色化、智能化 […]

发布时间:2025年12月8日
Meta签约多家媒体,为AI提供实时新闻

Meta签约多家媒体,为AI提供实时新闻

快速阅读: 据媒体报道,Meta与CNN、福克斯新闻等多家国际媒体签署AI数据合作协议,重启付费合作以提升Meta AI在新闻时效性与准确性方面的表现,并引导用户访问合作方网站。 日前,美国科技企业Meta宣布与多家国际新闻机构签署商业人工 […]

发布时间:2025年12月8日
Semaverse推AI平台赋能并购决策

Semaverse推AI平台赋能并购决策

快速阅读: 据最新消息,人工智能初创企业Semaverse近日推出“并购智能基础设施”平台,依托多智能体架构与智能记忆系统,为私募股权基金等提供覆盖交易全周期的五大智能化功能,助力数据驱动决策。 近日,人工智能初创企业Semaverse正式 […]

发布时间:2025年12月8日
Gartner建议全面禁用AI浏览器

Gartner建议全面禁用AI浏览器

快速阅读: 据Gartner发布消息称,AI浏览器存在严重数据安全与隐私风险,其侧边栏功能可能自动上传敏感信息至云端,企业部署前须严格评估后端安全机制并限制高危操作场景。 日前,国际知名研究机构Gartner发布风险警示,指出当前流行的AI […]

发布时间:2025年12月8日
利雅得航空携手IBM打造全球首家AI原生航司

利雅得航空携手IBM打造全球首家AI原生航司

快速阅读: 据最新消息,IBM依托混合云与红帽OpenShift技术,为175国客户提供AI及量子计算等创新方案,加速金融、医疗等关键领域数字化转型,深化本地化服务以提升全球产业链智能化水平。 国际商业机器公司(IBM)日前宣布,其作为全球 […]

发布时间:2025年12月8日
英语国家民众对AI更悲观

英语国家民众对AI更悲观

快速阅读: 据YouGov发布消息称,其2025年8月对九国调查显示,西欧民众对AI态度较积极,英语国家更悲观,就业影响最受担忧,而医疗、办公等领域获普遍认可。 日前,国际民调机构YouGov发布一项涵盖九国的调查报告显示,公众对人工智能( […]

发布时间:2025年12月8日
AI无法替代税务专家的判断与质疑

AI无法替代税务专家的判断与质疑

快速阅读: 12月8日消息,专家警示AI在税务申报中存在合规与伦理风险,强调其无法替代专业判断,呼吁合理界定应用边界,防范不法机构借智能算法诱导激进申报,确保人机协同、合法合规。 近日,有关人工智能在税务申报领域应用的讨论引发关注。专家指出 […]

发布时间:2025年12月8日
德州法学院以伦理先行培养AI时代律师

德州法学院以伦理先行培养AI时代律师

快速阅读: 据彭博法律报道,美国得州多所法学院以伦理为先推动AI审慎融入法律教育,要求明确使用规范并强调人类判断不可替代,呼应州律师协会第705号伦理准则。 近日,美国得克萨斯州在人工智能时代积极探索法律教育的务实路径,强调以伦理为先、审慎 […]

发布时间:2025年12月8日