大规模减少云浪费:Akamai 使用 kubernetes 编排的 AI 代理节省了 70% 的成本
快速阅读: 据《VentureBeat 公司》称,阿卡迈与Kubernetes自动化平台Cast AI合作,成功削减了40%-70%的云成本,解决了在多云环境中高效利用资源的问题。Cast AI的自动化平台通过AI代理持续监控、分析并优化云资源,确保性能不受影响。这一合作不仅大幅降低了成本,还释放了阿卡迈团队的时间,使他们能专注于核心业务功能开发。
加入近二十年来企业领袖信赖的活动。VB 转型大会将汇聚构建真正企业级AI战略的人们。了解更多,特别是在生成式AI初现的时代,云成本达到了历史最高点。但这不仅仅是因为企业使用了更多的计算资源——他们并没有高效地利用这些资源。事实上,今年企业预计将浪费445亿美元在不必要的云支出上。这对阿卡迈来说是一个加剧的问题:该公司在多个云平台上拥有庞大且复杂的云基础设施,更不用说众多严格的安全要求。
为了解决这个问题,这家网络安全和内容交付提供商转向了Kubernetes自动化平台Cast AI,其AI代理帮助优化跨云环境的成本、安全性和速度。最终,该平台帮助阿卡迈减少了40%至70%的云成本,具体取决于工作负载。
“我们需要一种持续优化我们基础设施并降低云成本的方法,而不会牺牲性能,”阿卡迈云工程高级总监德克尔·沙维特告诉《VentureBeat》。“我们是处理安全事件的人。延迟不是一个选项。如果我们无法实时响应安全攻击,我们就失败了。”
监控、分析和行动的专业代理
Kubernetes管理运行应用程序的基础设施,使其更容易部署、扩展和管理,尤其是在云端原生和微服务架构中。创始人兼首席执行官劳伦特·吉尔解释说,Cast AI已经整合到Kubernetes生态系统中,以帮助客户扩展集群和工作负载,选择最佳基础设施并管理计算生命周期。其核心平台是应用性能自动化(APA),通过一支专业代理团队持续监控、分析并采取行动以改善应用性能、安全性、效率和成本。
公司只需从AWS、微软、谷歌或其他地方提供所需的计算资源。APA由几个机器学习(ML)模型驱动,这些模型基于历史数据和学习模式,并通过可观测性堆栈和启发式方法增强,还与多个云上的基础设施即代码(IaC)工具结合,使其成为一个完全自动化的平台。吉尔解释说,APA建立在可观察性只是起点的原则之上;正如他所说,可观察性是“基础,而不是目标”。
Cast AI还支持逐步采用,因此客户不需要拆除和替换现有工具;他们可以将其集成到现有的工具和工作流程中。此外,所有分析和操作都在客户的专用Kubernetes集群内进行,从而提供更高的安全性和控制力。吉尔还强调了以人为本的重要性。“自动化补充人类决策,”他说,APA维持着人机协作工作流。
阿卡迈的独特挑战
沙维特解释说,阿卡迈庞大的复杂云基础设施支持向“一些世界上最苛刻的客户和行业”交付内容分发网络(CDN)和网络安全服务,同时遵守严格的SLA和性能要求。他指出,对于他们消费的一些服务,他们可能是供应商的最大客户之一,并且已经与超大规模云服务商进行了“大量的核心工程和重新设计”,以满足他们的需求。
此外,阿卡迈服务于各种规模和行业的客户,包括大型金融机构和信用卡公司。公司的服务直接关系到其客户的安全态势。最终,阿卡迈需要在这复杂性与成本之间取得平衡。沙维特指出,对客户的实际攻击可能会使其基础设施某些部分的能力提高100倍或1000倍。但他表示,“提前将我们的云容量扩大1000倍在经济上是不可行的。”
他的团队考虑过在代码层面进行优化,但其业务模型的固有复杂性要求他们专注于核心基础设施本身。
自动优化整个Kubernetes基础设施
沙维特解释说,阿卡迈真正需要的是一个Kubernetes自动化平台,能够在多个云平台上实时优化其整个核心基础设施的成本,并根据不断变化的需求上下调整应用程序。但所有这一切都必须在不牺牲应用程序性能的情况下完成。
在实施Cast之前,沙维特提到阿卡迈的DevOps团队每月手动调整其Kubernetes工作负载仅几次。鉴于其基础设施的规模和复杂性,这既具有挑战性又成本高昂。通过偶尔分析工作负载,他们显然错过了任何实时优化的机会。“现在,数百个Cast代理也做同样的调优工作,只不过它们每秒都在进行,”沙维特说。
阿卡迈使用的APA核心功能包括自动扩展、深度Kubernetes自动化(通过容器打包最小化使用的容器数量)、自动选择最具成本效益的计算实例、工作负载合理化、在整个实例生命周期中的抢占式实例自动化以及成本分析能力。
“我们在集成开始两分钟后就获得了成本分析的洞察,这是我们以前从未见过的,”沙维特说。“一旦活跃代理部署到位,优化就会自动启动,节省也开始显现。”
抢占式实例——企业可以在折扣价格下访问未使用的云容量——显然在商业上有意义,但沙维特指出,由于阿卡迈复杂的负载,尤其是Apache Spark,它们变得复杂起来。这意味着他们要么需要过度配置工作负载,要么投入更多人力,这在财务上并不合算。通过Cast AI,他们能够以“零投资”从工程团队或运营团队使用Spark的抢占式实例。抢占式实例的价值“非常明显”;他们只需要找到合适的工具即可使用它们。这是他们决定与Cast合作的原因之一,沙维特指出。
虽然节省2倍或3倍的云账单很棒,但沙维特指出,没有人工干预的自动化是“无可估量的”。它带来了“巨大的”时间节省。在实施Cast AI之前,他的团队一直在“不断调整调节参数”,以确保生产环境和客户达到所需的服务水平。
“最大的好处无疑是,我们不再需要管理基础设施了,”沙维特说。“Cast的代理团队现在为我们做这件事。这让我们团队得以专注于最重要的事情:更快地向客户提供功能。”
编辑注:本月的VB转型大会上,Google Cloud首席技术官威尔·格拉纳尼斯和Highmark Health高级副总裁兼首席分析官理查德·克拉克将讨论医疗领域的AI新栈以及在复杂受监管环境中部署多模型AI系统的实际挑战。立即报名。
每日VB快讯商业用例实时洞察
如果你想给老板留下深刻印象,VB快讯可以帮你实现。我们将告诉你公司如何使用生成式AI,从监管变化到实际部署,以便你分享见解以获得最大收益。立即订阅。
阅读我们的隐私政策
感谢订阅。
查看更多VB快讯。
发生错误。
(以上内容均由Ai生成)