F5 和 NVIDIA 通过增强的 LLM 路由和安全性扩展 AI 基础设施

发布时间:2025年6月17日    来源:szf
F5 和 NVIDIA 通过增强的 LLM 路由和安全性扩展 AI 基础设施

快速阅读: 据《快速模式》称,F5推出基于NVIDIA BlueField-3 DPU的BIG-IP Next,强化Kubernetes应用交付与安全性。该方案经Sesterce验证,提升GPU利用率20%,优化AI推理,扩展模型上下文协议。F5与NVIDIA合作,开启AI基础设施新可能,提供高效流量管理与安全解决方案。

F5,全球应用交付与安全领域的领军者,宣布其面向Kubernetes的F5 BIG-IP Next新增功能正式上线。这一功能由NVIDIA BlueField-3 DPU加速,并基于NVIDIA DOCA软件框架,同时得到了客户Sesterce实际部署验证的支持。Sesterce是一家领先的欧洲运营商,专注于下一代基础设施和主权人工智能,致力于满足加速计算和人工智能的需求。

通过扩展F5的应用交付与安全平台,运行在NVIDIA BlueField-3 DPU上的BIG-IP Next为大规模人工智能基础设施提供了高性能的流量管理和安全性,从而解锁了人工智能应用更高的效率、控制和性能。同时,Sesterce成功完成了对F5和NVIDIA解决方案在多个关键能力方面的验证,包括以下领域:

– 提升性能、多租户和安全性以满足云级期望,初步显示GPU利用率提升了约20%。
– 与NVIDIA Dynamo及KV缓存管理器集成,减少大型语言模型(LLM)推理系统的推理延迟,并优化GPU和内存资源。
– 在BlueField DPU上进行智能LLM路由,与NVIDIA NIM微服务有效配合处理需要多个模型的工作负载,帮助客户快速且安全地利用所有可用模型的最佳特性。
– 扩展和保护模型上下文协议(MCP),包括反向代理功能和保护措施,使LLM更加可扩展和安全,助力客户快速、安全地利用MCP服务器的强大功能。
– 借助强大的F5 iRules功能实现数据可编程性,允许快速定制以支持AI应用和不断发展的安全需求。

新解决方案的功能亮点包括:

– 使用BIG-IP Next for Kubernetes进行LLM路由和动态负载均衡。
– 通过NVIDIA Dynamo及KV缓存管理器集成优化分布式AI推理中的GPU使用。

Youssef El Manssouri,Sesterce首席执行官兼联合创始人表示:“在我们进行任何测试之前,F5和NVIDIA之间的集成就已极具吸引力。我们的结果强调了F5在高容量Kubernetes入口和出口方面动态负载平衡的优势。这种方法使我们能够更有效地分配流量并优化GPU的使用,同时为客户带来额外的独特价值。我们很高兴看到F5对越来越多的NVIDIA用例的支持,包括增强的多租户,并期待两家公司在支持下一代AI基础设施方面的更多创新。”

Kunal Anand,F5首席创新官表示:“企业正在越来越多地部署多个LLM来推动先进的AI体验——但路由和分类LLM流量可能计算密集,会降低性能和用户体验。通过直接在NVIDIA BlueField-3 DPU上编写路由逻辑,F5 BIG-IP Next for Kubernetes是交付和保护LLM流量的最高效方法。这只是个开始。我们的平台为AI基础设施开启了新的可能性,我们对与NVIDIA深化合作创新充满期待,因为企业AI将继续扩展。”

Ash Bhalgat,NVIDIA AI网络与安全解决方案高级总监表示:“由NVIDIA BlueField-3 DPU加速的BIG-IP Next for Kubernetes为企业和服务提供商提供了一个单一的控制点,可以高效地将流量路由到AI工厂以优化GPU效率,并加速数据摄取、模型训练、推理、RAG和自主AI的AI流量。此外,F5对多租户和iRules增强编程的支持持续为集成和功能扩展提供理想的平台,例如对NVIDIA Dynamo分布式KV缓存管理器的支持。”

Greg Schoeny,World Wide Technology全球服务提供商高级副总裁表示:“采用自主AI技术的机构越来越依赖MCP部署来提高LLM的安全性和性能。通过将先进的流量管理和安全性引入广泛的Kubernetes环境,F5和NVIDIA正在提供集成的AI功能集——以及编程和自动化能力——这些功能在行业内其他地方尚未见到。”

(以上内容均由Ai生成)

关键词: AiF5LlmNvidia路由

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日