使用 Causely 将人类从可观测性循环中解放出来
快速阅读: 《IBTimes (英文)》消息,Causely旨在解决监控系统警报过多的问题,通过因果推理快速定位根本原因。与Grafana合作后,工程师可更快识别性能问题。创始人什穆埃尔·克利格认为未来IT运营将实现自主管理。
Causely 是现代运维领域的新晋成员。它的核心理念很简单:你的监控系统太吵了。在众多警报和仪表盘中锁定根本原因需要耗费大量时间。而随着人工智能的崛起,这一问题变得更加棘手。其创始人什穆埃尔·克利格多年来一直思考着 IT 运营与复杂系统的管理之道。他在管理复杂系统方面有着一些反传统的观点。首先,他不认同许多现代监控平台推崇的“收集所有数据”的策略。尽管存储数据的成本确实下降了,但数据量却急剧膨胀。更重要的是,除了数据收集带来的成本压力外,单纯的事实是其中 80% 的数据将永远派不上用场。换言之,为了追求完全可见性,团队不得不接受海量噪声。当需要处理警报或应对客户投诉时,这些冗余的数据反而成为阻碍,使找到可操作的根本原因如同大海捞针般艰难。相反,克利格认为企业应采取“自上而下”的方式,从可能的根本原因入手,再深入挖掘必要数据。他打造的平台名为 Causely,借助因果推理将监控信号映射至潜在的根本原因。克利格还直截了当地提出,在不远的将来,人类将不再参与 IT 运营的管理工作。“飞机可以自动驾驶——凭什么我们认为 IT 运营不能实现自主?”他向我们发问。不过他也承认,这是一段渐进的过程,我们尚未完全抵达那个阶段——但越来越多的情况下,我们应该期待机器能够识别性能、安全性和可靠性问题。该公司与 Grafana 的最新合作是一项重要进展。Grafana Labs 是全球广受欢迎的开源仪表盘背后的企业,拥有超过 2500 万用户。通过将 Causely 的智能融入 Grafana 仪表盘,工程师能在服务背景下即时看到性能问题的“为什么”,极大缩短了解决时间,特别是在面对警报时。Causely 还强化了 Grafana Alertmanager,在现有警报中加入实时、持续更新的根本原因智能。这项由人工智能驱动的功能超越了简单的错误警报,深入挖掘问题根源及事件响应工作流中的下一步行动。“工程师被现有监控解决方案的繁杂工具、警报和数据淹没,”克利格表示,“我们正致力于简化将我们的解决方案整合到现有工作流程中的过程,并大幅削减在复杂现代应用中识别根本原因所需的繁琐手动操作。”
—
**Causely:为运维减噪赋能**
在数字时代,IT 运营的复杂性不断攀升,监控系统警报泛滥成灾,工程师们往往陷入海量数据的汪洋之中,难以迅速定位问题的根本原因。Causely 的诞生正是为了解决这一痛点。它以简洁的理念切入市场:你的监控系统需要安静下来。
Causely 的创始人什穆埃尔·克利格对 IT 运营的未来有着独到见解。他认为,盲目地“收集所有数据”只会导致资源浪费,因为其中大部分数据根本不会被使用。相反,他倡导“自上而下”的方法,即从可能的根本原因出发,逐步深入分析所需数据。这种策略不仅提高了效率,还帮助工程师快速锁定关键问题。
克利格大胆预测,未来人类将不再是 IT 运营的核心管理者。“飞机都能自动驾驶了,为什么我们不能赋予 IT 系统同样的自主能力?”他质问。尽管全面自动化尚需时日,但他坚信,机器将在性能、安全性和可靠性问题的识别上发挥越来越重要的作用。
最近,Causely 与 Grafana 的深度整合标志着一次重要突破。作为全球领先的开源仪表盘供应商,Grafana 拥有超过 2500 万用户。通过将 Causely 的智能嵌入 Grafana 仪表盘,工程师可以瞬间获取性能问题的深层原因,显著提升解决问题的速度。此外,Causely 还升级了 Grafana Alertmanager,让警报不仅仅是通知,更是指引行动的方向标。
“工程师们正在被过多的工具、警报和数据淹没,”克利格说道,“我们希望简化集成过程,最大限度减少手动操作的繁琐,帮助他们专注于真正重要的事情。”
Causely 的出现,无疑为运维领域的革新注入了一股强劲动力。在未来,我们或许真的能见证一个无需人工介入的智能化运维新时代。
(以上内容均由Ai生成)