Google Cloud Run 现在提供用于 AI 和批处理的无服务器 GPU

发布时间:2025年6月9日    来源:szf
Google Cloud Run 现在提供用于 AI 和批处理的无服务器 GPU

快速阅读: 据《InfoQ 公司》最新报道,谷歌云正式推出Cloud Run的NVIDIA GPU支持,开发者可通过简单设置启用,按秒计费且可缩放至零。该服务已在五个区域上线,适合AI推理和批处理任务,但价格相较其他服务商无明显优势。

谷歌云正式推出对Cloud Run(其无服务器运行时)的NVIDIA GPU支持。通过这一增强功能,谷歌云旨在为广泛的应用场景提供强大且经济高效的GPU加速环境,特别是在人工智能推理和批处理领域。

在一篇公司博客文章中,谷歌强调开发者因Cloud Run的简洁性、灵活性和可扩展性而对其青睐有加。如今,新增的GPU支持进一步增强了其核心优势:

– **按秒计费**:用户仅需为其实际使用的GPU资源秒数付费,从而有效减少浪费。
– **缩放至零**:当处于非活动状态时,Cloud Run会自动将GPU实例数量缩减至零,避免产生闲置成本——这对间歇性或不可预测的工作负载尤其有利。
– **快速启动与扩展**:配备GPU和驱动程序的实例可以在不到5秒内启动,确保应用程序能够迅速响应需求。
– **完全流媒体支持**:内置对HTTP和WebSocket流媒体的支持,使得交互式应用成为可能,比如实时的语言模型响应。

NVIDIA加速计算产品总监戴夫·萨尔瓦托评论道:“一个重要的障碍已被清除,因为开发者无需申请配额即可在Cloud Run上使用NVIDIA L4 GPU支持。他们可以通过简单的命令行标志(例如添加`–gpu 1`参数)或在Google Cloud控制台中勾选相关选项来启用GPU支持。”

配备了GPU支持的Cloud Run现已达到生产就绪状态,并受到Cloud Run服务水平协议(SLA)中关于可靠性和正常运行时间的保障。默认情况下提供区域冗余以提高弹性,同时也可以选择较低的价格以实现尽力而为的故障转移。

Cloud Run上GPU支持的全面上线引发了开发社区对其竞争优势的热烈讨论,尤其是与其他主要云服务提供商的关系。ZenRows首席软件工程师鲁本·德尔·卡米诺指出:“谷歌的这一举措是‘AWS多年来应该构建的东西:真正可用的无服务器GPU计算。’”他强调了AWS Lambda在功能上的局限性,比如15分钟的超时限制和仅限CPU计算对现代AI工作负载(如Stable Diffusion推理、模型微调或实时视频分析)构成的阻碍。“尝试在Lambda中运行Stable Diffusion推理、微调模型或使用AI处理视频——你做不到。”用户评论说,强调Cloud Run GPU让这些任务在可以缩放到零的无服务器GPU上变得轻而易举。

尽管Cloud Run GPU提供了令人印象深刻的功能,但Hacker News论坛上的一些用户对缺乏硬性账单限额表示担忧,这可能导致意外的成本增加。虽然Cloud Run允许设置最大实例限制,但它并未提供基于美元的实际支出上限。此外,在同一Hacker News论坛上的比较还显示,其他提供商(如Runpod.io)可能为类似的GPU实例提供更具竞争力的价格。例如,一些用户指出,Runpod的L4、A100和H100 GPU的每小时费率显著低于谷歌,即便考虑到谷歌的按秒计费。

除了实时推理之外,谷歌还宣布了在Cloud Run作业(目前处于私人预览阶段)上提供GPU的可用性,解锁了新的批量处理和异步任务用例。这些功能在全球范围内得到支持,Cloud Run GPU目前在五个Google Cloud区域可用:美国内布拉斯加州的us-central1、比利时的europe-west1、荷兰的europe-west4、新加坡的asia-southeast1以及印度孟买的asia-south1。未来还将增加更多区域。

最后,该公司表示,开发人员可以通过利用官方文档、快速入门指南以及优化模型加载的最佳实践开始使用Cloud Run GPU进行构建。

关于作者
斯蒂夫·扬格斯
显示更多
显示更少

(以上内容均由Ai生成)

关键词: AicloudGoogleGpurun

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日