K8s 中的可观测性:从反应式转变为预测式

发布时间:2025年4月3日    来源:szf
K8s 中的可观测性:从反应式转变为预测式

快速阅读: 据《新堆栈》最新报道,2025年欧洲KubeCon大会聚焦Kubernetes可观测性,探讨从被动到预测的转变。采用统一遥测管理、OpenTelemetry和AI驱动分析,应对复杂性和成本挑战,推动云原生环境的可观测性发展。

2025年欧洲KubeCon + CloudNativeCon大会/可观测性/运维/从被动到预测的K8s可观测性

通过采用统一的遥测管理方法、开放标准如OpenTelemetry以及AI驱动的分析,应对复杂性和成本挑战。

2025年4月2日 上午9:00
作者:洛里·贝尔特利
图片来源:Enrique / Pixabay
Apica赞助了这篇文章。

随着组织部署越来越复杂的Kubernetes环境,云原生可观测性的格局继续迅速发展。2025年欧洲KubeCon + CloudNativeCon大会提供了一个很好的时机来审视可观测性是如何演进的,当前面临的挑战以及新兴的AI驱动解决方案如何有望将这一领域从被动转向预测。

在过去十年中,可观测性已经经历了显著的发展,并且在AI时代继续进步。我们正处于另一个关键时刻,这将从根本上改变团队观察和管理其系统的方式。

**观测性的复杂性增加**

运营云原生应用程序的组织遇到了关于监控和可观测性的共同挑战。Kubernetes环境在分布式系统、容器化应用程序和微服务之间生成大量遥测数据,造成了显著的数据管理挑战。许多组织正在经历存储和处理这些可观测性数据的成本迅速上升。

一个特别严峻的挑战是如何控制数据增长和基数。随着微服务和Kubernetes的使用,基数近年来有所增长,而AI驱动的应用程序将进一步加速这一趋势。为了控制成本而丢弃数据是不可行的,因为团队需要更细粒度的数据来理解复杂的系统。

运营云原生应用程序的组织遇到了关于监控和可观测性的共同挑战。Kubernetes环境在分布式系统、容器化应用程序和微服务之间生成大量遥测数据,造成了显著的数据管理挑战。许多组织正在经历存储和处理这些可观测性数据的成本迅速上升。

这种复杂性不仅仅体现在数据量和成本上。由于多个监控工具之间的碎片化可见性,团队经常面临挑战,这使得在技术栈的不同部分之间关联问题变得困难。这种碎片化带来了重大问题:工程团队面临噪音和告警疲劳,使识别和解决关键问题变得更加困难。此外,随着全球隐私法规变得更为严格,确保日志和指标中的敏感数据符合监管要求变得越来越重要。这些挑战在Kubernetes环境中尤为突出,其中工作负载的动态和短暂特性为传统的监控方法增加了更多复杂性。

仅存在几分钟或几秒的容器、自动扩展的工作负载和不断变化的基础架构都导致传统工具难以有效管理的监控环境。

**统一的遥测管理:现代方法**

现代可观测性平台已经超越基本监控,提供了统一的遥测数据管理。这种全面的方法为企业应对云原生环境的复杂性提供了几个优势。

**集中式管道管理**

组织正在从管理多个不相连的工具转向对所有遥测数据的集中控制平面。这种策略确保了在Kubernetes集群、云服务和本地基础设施之间的一致数据收集,消除了盲点并降低了操作员的认知负荷。当数据被一致地收集和管理时,可以实现对应用程序、基础设施和安全态势的全栈可见性。这种集中化还能够与现有的Kubernetes监控工具和平台无缝集成,利用已有的投资同时添加新功能。

**动态车队管理**

传统的静态遥测方法正被动态、灵活的系统取代,这些系统可以根据变化的环境进行调整。现代可观测性解决方案可以根据实时环境因素自动扩展数据收集,确保资源得到高效利用。代理部署的集中配置管理减少了在大型服务器和容器舰队中管理可观测性组件的操作负担。这种方法简化了分布式环境中可观测性组件的生命周期管理,使升级和配置更加易于管理。

**智能数据流控制**

控制遥测数据流对于成本管理和性能优化变得至关重要。先进的可观测性平台现在提供了过滤和减少嘈杂、冗余数据的能力,同时不会丢失关键见解。它们可以屏蔽和转换敏感信息,以确保符合GDPR和《加州消费者隐私法》(CCPA)等法规,保护用户隐私的同时保持可观测性。

许多系统现在支持用额外的上下文丰富遥测数据,以获得更深入的见解,结合来自多个来源的数据,提供更完整的系统行为视图。数据路由中的智能允许高价值数据发送到专门的分析工具,同时以低成本方式存储完整的高保真副本,以便在需要时进行后续分析。

**专用数据存储**

随着专用可观测性数据湖的兴起,一种重要的架构转变正在发生。这使组织能够轻松管理海量数据,与对象存储集成,并索引和访问所有数据。能够即时索引传入数据并按需实时访问消除了分层存储的需求。可以将其视为存储任务终结者。

专为可观测性数据设计的目的性数据仓库帮助组织解决了存储和查询时间序列数据、日志和跟踪的独特挑战。这些专业仓库使团队能够在规模上以优化成本存储操作数据,通常比通用数据库节省大量成本。

随着专用可观测性数据湖的兴起,一种重要的架构转变正在发生。这使组织能够轻松管理海量数据,与对象存储集成,并索引和访问所有数据。能够即时索引传入数据并按需实时访问消除了分层存储的需求。可以将其视为存储任务终结者。

通过将对象存储作为主要存储层并增强其性能以匹配实时存储能力,这些解决方案消除了分层存储的需求,同时提供了对所有传入数据的完全索引。这种方法支持在不超出预算的情况下维持长期保留期,允许团队调查数周、数月甚至数年前发生的事件。

这种架构方法解决了几个关键挑战:跨不同类型的遥测数据(指标、日志、跟踪和事件)的相关性,这些数据通常分开存储,实现对这些数据源的快速查询,并通过集中日志管理提供合规路径。该领域的先进解决方案允许“时光旅行”功能,可以在任何时间段内查询、检索和重放历史数据。

高性能查询功能使团队能够快速分析历史数据,通常使用像Apache Parquet这样的格式,确保大规模数据的可用性、简化检索并加快洞察能力。

现代可观测性数据湖的弹性设计即使在最庞大的数据环境中也能确保高可用性,具有水平扩展能力,可以处理端点上的意外数据峰值,避免积压并在大规模情况下防止数据丢失。

**推动企业级可观测性转型的关键能力**

下一代可观测性平台的一些关键能力正在显现,随着行业成熟以及组织在云原生环境中的经验积累,这些能力变得至关重要。

**OpenTelemetry 成为中立厂商的可观测性基础**

OpenTelemetry 已成为中立厂商的可观测性基础,组织采用它来在其应用程序中标准化度量采集。这一开放标准有助于减少厂商锁定,并简化与多种可观测性解决方案的集成工作,为组织提供了更多工具选择的灵活性。通过采用 OpenTelemetry,组织也在为其可观测性战略奠定未来的基础,确保能够适应不断变化的环境。

**人工智能和机器学习的变革力量**

人工智能和机器学习正在改变团队解释可观测性数据的方式,将范式从被动响应转变为预测性。尽管人工智能通过增加复杂性和非确定性行为为可观测性带来了新的挑战,但它也提供了强大的解决方案。

由人工智能驱动的根本原因分析(RCA)正成为一个变革者,自动化了工程团队在排查问题时面临的大量手动工作。这些技术通过快速自动识别问题根源,帮助减少了平均恢复时间(MTTR)。无需工程师手动查询日志、关联跟踪或筛选仪表板,人工智能系统可以主动识别潜在问题,从而从根本上将操作从被动响应转变为主动预防。

人工智能可观测性系统将专注于对海量遥测数据进行深度模式分析。基于机器学习的异常检测可以识别出在大量数据洪流中可能被忽略的安全威胁或性能问题。随着这些系统的成熟,它们将越来越多地生成系统优化的操作建议,帮助团队提高可靠性和性能。

**成本优化与数据管理**

随着可观测性数据量的增长,成本优化已成为所有规模组织的主要关注点。团队正在制定策略,以识别并过滤掉噪声和冗余数据,同时不丢失关键洞察。许多组织采用了智能采样技术,在减少总体数据量的同时保留重要数据。针对不同类型数据的分层存储策略通过将高频访问的数据存储在快速存储上,而将历史数据转移到更便宜的存储选项上来优化成本。

先进的压缩和数据缩减技术有助于应对数据量增长带来的成本压力。现代可观测性方法正在帮助组织打破开发、运维和安全团队之间的壁垒。共享仪表盘和统一可见性确保每个人都使用相同的数据,减少指责并改善协作。当所有团队都能访问相同的可观测性数据时,跨职能团队在问题识别方面的协作变得更加自然。

适用于不同团队视角的通用数据模型有助于填补开发人员、运维人员和安全专业人员之间的语言空白。最佳解决方案支持专家的专业视图和跨职能团队成员的通用视图,确保每个人都能获得所需的洞察。

**未来的发展路径**

随着团队齐聚 KubeCon + CloudNativeCon EU 2025,围绕可观测性的讨论可能会受到若干趋势的影响。行业正在朝着民主化企业级可观测性方向发展,使强大工具不再局限于资源丰富的大型企业,而是能让各种规模的团队都能使用。

组织正在围绕可观测性数据实施更强有力的治理,以管理成本并确保合规性,将可观测性数据视为需谨慎管理的宝贵资源。为技术指标添加业务和应用上下文变得越来越重要,因为组织寻求理解技术问题对现实世界影响的重要性。这种上下文智能有助于弥合 IT 指标与业务成果之间的差距,使可观测性对组织更具价值。

人们也越来越认识到,可观测性应尽早考虑在开发生命周期中,而不是作为事后补充。团队正在构建标准化、可重复的方法,在不同的服务和环境中实现可观测性,确保整个组织内部的数据收集和监控实践保持一致。

**可观测性的下一个十年**

Kubernetes 和云原生环境的可观测性格局继续迅速演变。组织可以通过采用统一的遥测管理方法、拥抱像 OpenTelemetry 这样的开放标准和人工智能驱动的分析方法,解决日益增长的复杂性和成本挑战,同时深入了解其系统。

展望未来,可观测性的重点将继续放在赋予工程师通过预测性和预防性方法理解和优化其系统的增强能力上。KubeCon + CloudNativeCon EU 2025 的讨论无疑将塑造云原生可观测性的未来方向,并帮助组织构建更具弹性和可观察性的系统。

云原生社区的集体创新继续产生解决方案,使复杂的分布式系统更加易于管理、可靠且经济高效。Apica 通过其统一平台 Ascent 提供可观测性和数据管理,帮助简化处理遥测数据的复杂性。收集、转换、路由、存储、观察和分析数据,并保持全面的成本控制。

了解更多信息:
Apica 最新动态
热门故事
YOUTUBE.COM/THENEWSTACK
科技发展迅速,不要错过任何一集。订阅我们的 YouTube 频道,观看我们所有的播客、采访、演示等内容。

订阅
小组创建于草图。

洛里·贝尔特利是 Apica 的产品营销和传播总监。凭借提升 B2B 技术公司市场领导地位的记录,她专长于打造引起共鸣且具有差异化效果的信息。作为一名产品营销和传播战略家,洛里……

了解更多来自洛里·贝尔特利的文章

Apica 赞助了这篇文章。

分享这个故事

热门故事

分享这个故事

(以上内容均由Ai生成)

你可能还想读

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日
人工智能将导致财富、权力的集中;必须使用人工智能来解决社会挑战:Nilekani

人工智能将导致财富、权力的集中;必须使用人工智能来解决社会挑战:Nilekani

快速阅读: 据《印度教业务线》称,印度联合创始人纳南·尼莱卡尼表示,AI应用于解决实际问题,提升医疗与教育,强调简约设计和持续创新,反对全民基本收入,主张用AI放大人类潜力。 据《亚洲时报》报道,7月27日,纽约,印度信息技术服务巨头Inf […]

发布时间:2025年8月1日