LLM能否破解AIOps落地困局

发布时间:2025年12月17日    来源:szf
LLM能否破解AIOps落地困局

快速阅读: 据多方确认,阿里云与云杉网络正推动LLM Agent在智能运维领域的落地,依托操作系统底座与eBPF技术提升协同效率;尽管受限于大模型“幻觉”问题,但通过安全护栏与生态共建,加速实现“零运维”愿景。

在大模型技术加速渗透运维领域的背景下,LLM Agent被寄予打破协同壁垒的厚望,但也面临“泡沫”质疑。业界普遍认为,当前AI能力与实际落地之间存在明显预期偏差。

阿里云智能集团运维总监、龙蜥社区系统运维联盟主席冯富秋指出,大模型在意图识别和文本分析方面优势显著,但深度推理能力仍显不足,容易产生“幻觉”——即输出看似合理却可能错误的结论。

云杉网络总裁向阳表示,LLM for AIOps是一场革命性变革。以银行系统发版为例,传统模式需多个部门及厂商驻场,如今人力投入已大幅减少,但仍无法实现完全无人值守,其发展状态类似于尚未脱离人工干预的自动驾驶。由于LLM具有柔性答案特性,必须通过Guardrail等机制约束其行为,并在实践中持续优化。

针对传统AIOps长期受制于数据质量与智能水平的问题,“OS + LLM Agent”新范式提供了破局路径。冯富秋解释,规则引擎难以处理复杂系统日志,小模型又缺乏高质量训练数据;而生成式大模型依托内在知识库,可在较少人工干预下实现更强泛化能力。向阳补充,操作系统通过eBPF等技术提供零侵扰、全量观测视角,为大模型注入结构化“燃料”,尤其适用于金融等高合规要求场景。

为保障LLM Agent这一“桥梁”的可靠性,双方从基础设施与应用两个层面构建安全护栏。阿里云强化操作系统稳定性,并研发AI观测能力以诊断Agent异常;云杉网络则聚焦GPU、网络等底层资源的可靠性,同时通过证据链回溯与人机协同机制提升决策可信度。

面向未来,冯富秋强调生态共建至关重要:阿里云将开放操作系统核心能力,联合伙伴发布解决方案,并计划推出脱敏运维工单测试集,填补行业基准空白。向阳则呼吁开发者积极融入开源社区,降低eBPF使用门槛,推动Multi-Agent在不同场景中形成闭环。

专家一致认为,LLM Agent终将成为服务器操作系统的标配,助力实现“零运维”愿景。但现阶段需理性看待其能力边界——既非万能银弹,亦非虚幻泡沫。行业应迈出实践第一步,夯实数据基础,通过持续反馈让智能体越用越强。

智能运维的演进源于技术落地过程中预期与现实的碰撞。LLM for AIOps虽非万能“银弹”,但凭借语义理解与跨部门协同能力,有效突破了传统AIOps的瓶颈。尽管因“幻觉”问题仍面临质疑,但在操作系统底座支撑、eBPF技术精准赋能及持续迭代下,该技术正逐步走向成熟。

此次变革的核心在于“协同”。阿里云与云杉网络推动生态协同,操作系统底座与LLM Agent实现技术协同,大模型与传统规则、小模型形成分工协同,人机之间也逐步建立高效决策协同机制。随着技术壁垒不断消融、数据与智能闭环持续构建、行业标准日益完善,LLM Agent有望从争议焦点转变为运维标配,推动“端着咖啡做运维”的愿景成为现实。

在AI重塑产业格局与国产化替代加速的背景下,《AI进化论:智算时代OS的破局之路》聚焦服务器操作系统在智算时代的融合演进。栏目围绕原生智能、原生安全、软硬协同等议题,邀请学术界与产业界代表,以阿里云服务器操作系统为例,系统解析其架构、演进路径与应用价值,为行业发展提供参考。

(以上内容均由Ai生成)

引用自:InfoQ网站

关键词: AiopsLlm落地困局

你可能还想读

企业AI治理聚焦员工实际工作场景

企业AI治理聚焦员工实际工作场景

快速阅读: 最新消息显示,企业加速部署AI协作者引发数据安全风险,敏感信息易在浏览器界面层泄露。专家建议通过角色分级、本地内容识别与合规通道,在提升效率的同时满足GDPR等法规要求。 企业正加速引入人工智能协作者与浏览器助手,但员工在实际使 […]

发布时间:2025年12月17日
科技界将助力缩小视障群体就业差距

科技界将助力缩小视障群体就业差距

快速阅读: 有消息指出,技术开发者正推动包容性设计,以弥合就业障碍,确保辅助工具与企业系统兼容可用。若忽视这一原则,一次系统更新就可能导致残障求职者或员工被排除在外;而早期纳入包容性考量成本极低,却能有效促进公平就业。 当前,许多人在进入劳 […]

发布时间:2025年12月17日
AI测评师推荐2025年三大免费高效工具

AI测评师推荐2025年三大免费高效工具

快速阅读: 据苹果公司消息,其将系统自带的语音备忘录应用评为2025年“年度iPhone应用”。该工具免费支持录音转文字、关键词搜索及音频回放,适用于iOS 18.0以上系统的iPhone 12及以上机型,为ADHD人群及高频录音用户提供高 […]

发布时间:2025年12月17日
企业将整合AI与地理技术推进气候智能决策

企业将整合AI与地理技术推进气候智能决策

快速阅读: 据了解,企业正加速融合可持续发展数据与运营系统,通过AI、地理空间技术及数字孪生构建“气候智能”能力,以驱动减排行动。但AI自身高能耗引发“可持续悖论”,凸显绿色IT透明度与净环境效益验证的紧迫性。 近年来,企业正加速将可持续发 […]

发布时间:2025年12月17日
亚马逊拟投资100亿美元入股OpenAI并供应Trainium芯片

亚马逊拟投资100亿美元入股OpenAI并供应Trainium芯片

快速阅读: 据金融时报报道,亚马逊计划向OpenAI投资100亿美元,并提供AI芯片及云服务,以推动其电商平台优化;作为回报,OpenAI将扩大使用AWS数据中心,采用亚马逊自研Trainium芯片,并叠加此前380亿美元的租赁承诺。 亚马 […]

发布时间:2025年12月17日
Instagram推电视版Reels应用

Instagram推电视版Reels应用

快速阅读: 据Meta公司消息,该公司近日开始公开测试适用于电视端的Instagram应用,目前仅支持亚马逊Fire TV设备,主推Reels短视频内容并按兴趣划分频道,未来将增加手机遥控、好友动态共享等功能以优化用户体验。 为满足用户在更 […]

发布时间:2025年12月17日
美金融机构以治理先行推进负责任AI

美金融机构以治理先行推进负责任AI

快速阅读: 消息人士透露,一家美国大型金融机构在推进人工智能应用前,优先构建以负责任AI原则为基础的治理框架,聚焦准确性、公平性与安全性等核心要素,在提升效率的同时防控风险。 一家总部位于美国的大型金融机构在看到人工智能提升运营效率的巨大潜 […]

发布时间:2025年12月17日
台电将发布AI数据中心电网安全新规

台电将发布AI数据中心电网安全新规

快速阅读: 据台电公司消息,人工智能数据中心用电需求无法仅靠延伸输电线路满足,须统筹评估当地供电能力,建议运营商优先在中南部布局,待北部电网扩容后再行建设,以优化电力资源配置并保障稳定运行。 台电公司指出,人工智能数据中心的用电需求无法仅靠 […]

发布时间:2025年12月17日