网络的 DeepSeek 时刻

发布时间:2025年4月23日    来源:szf
网络的 DeepSeek 时刻

快速阅读: 《快速模式》消息,深思探索的R1模型大幅降低了AI推理成本并提升训练效率,颠覆传统认知。文章指出AI推理对网络提出新挑战,包括流量峰值、低延迟、东西向流量优化等,呼吁网络团队采用智能路由、边缘计算及优化技术以应对未来需求。

深思探索(DeepSeek)凭借其令人震撼的R1模型给整个AI领域带来了巨大的冲击。该模型在推理计算量仅为大型AI公司领先推理最优模型(SOTA)的1/50成本的情况下,训练效率提升了20倍。在网络领域,深思探索的影响将在未来多年持续回荡。通过展示在规模化情况下推理时间的学习既经济又快速这一概念,深思探索颠覆了人们对AI应用行为的传统认知。推理流量和使用量可能比之前基于预训练和计算集群规模扩展规律所理解的高出几个数量级。进一步的研究发现,要求模型花费更多时间思考并生成更多选项可以改善结果,这同样会增加推理需求。这需要采用边缘计算、延迟感知路由以及优化的互联技术,从根本上改变网络运维团队对AI流量的思考方式。

与在受控批量环境中进行的AI训练不同,AI推理通常在实时中发生,且常常以不可预测的方式爆发。这种动态行为对网络有以下几方面的意义:

1. **流量峰值和突发**
AI推理工作负载可能高度事件驱动,这意味着请求可能突然激增(例如,一个热门聊天机器人、欺诈检测系统或实时推荐引擎)。网络需要具备流量感知能力的路由策略,以尽量减少跨云延迟和出口费用。同时,需要智能负载均衡和动态路由等弹性扩展机制,以避免瓶颈和服务降级。

2. **超低延迟成为关键任务**
AI推理经常支持实时决策(例如,自动驾驶汽车、医疗诊断、金融交易)。即使增加几毫秒的延迟也可能导致收入损失、交易失败或不准确的AI输出。这需要采用边缘计算、延迟感知路由以及优化的互连技术,将推理更接近用户和数据源。

3. **AI推理更倾向于东西向的数据中心内部流量**
与传统应用主要为南北向流量(客户端-服务器交互)不同,AI推理依赖于数据中心内部的高速东西向流量。因此,网络必须优化推理节点、存储和支持微服务之间的快速数据中心内通信。诸如InfiniBand、以太网上的远程直接内存访问(RoCE)以及NVMe-over-Fabric等高速互联技术变得尤为重要。

4. **API驱动的工作流需要负载感知的流量管理**
AI推理通常通过API提供服务,这意味着每个请求都必须被高效处理和路由。传统的负载均衡可能不够——AI工作负载需要具有应用感知和GPU感知的负载均衡来引导请求到最不繁忙或最优化的推理节点。这也意味着管理请求优先级,确保关键AI任务(例如,欺诈检测)不会因较低优先级的工作负载(例如,图像生成请求)而延迟。高性能且对开发者友好的API网关对于保障安全性和实现可扩展性至关重要。

5. **多云和边缘推理需要智能路由**
AI推理正变得越来越分散,工作负载分布在本地、云和边缘环境中。这需要具备流量感知能力的路由策略,以尽量减少跨云延迟和出口费用。边缘部署以使推理靠近用户(例如,现场处理视频的AI驱动安全摄像头)。混合网络策略用于权衡成本、速度与可靠性。

6. **可观测性和性能优化成为必要**
AI推理需要持续监控网络延迟、带宽使用和节点健康状况以保持性能。网络、站点可靠性工程(SRE)及机器学习运维(MLOps)团队都需要实时的可观测工具,集成AI特定指标,如:每请求的模型响应时间、每个推理节点的GPU/TPU利用率以及多云设置中的延迟变化。

**结论**
AI推理网络必须是自适应、可扩展且超低延迟的。推理时间的扩展迫使网络运营团队重新思考他们的基础设施——专注于弹性、低延迟路由和智能流量管理,以保持AI驱动的服务平稳运行。

本文中的观点仅属于作者个人观点,不代表《快模式》(The Fast Mode)。尽管本帖提供的信息来自《快模式》认为可靠的来源,但《快模式》不对任何因信息局限、变更、不准确、误导、遗漏或错误而导致的损失或损害承担责任。标题仅为便于查阅。

(以上内容均由Ai生成)

关键词: Deepseek时刻网络

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日