新的 AI 计算：与 OpenAI 的生态系统相比，Google 80% 的成本优势

快速阅读: 据《VentureBeat 公司》称，谷歌和OpenAI在AI领域竞争激烈，谷歌通过自研TPU大幅降低成本，而OpenAI依赖Nvidia GPU成本较高。企业需综合考虑计算成本、代理框架、模型能力和企业适配性等因素选择合适的AI平台。

订阅我们的每日和每周简报，获取业内领先的AI报道的最新资讯和独家内容。了解更多信息，生成式AI创新的步伐从未停歇。就在过去几周，OpenAI发布了强大的O3和O4-Mini推理模型，以及GPT-4.1系列，而谷歌推出了Gemini 2.5 Flash，并在其旗舰产品Gemini 2.5 Pro的基础上快速迭代。对于在这一复杂环境中导航的企业技术领导者而言，选择合适的AI平台需要超越快速变动的模型基准。

尽管模型间基准测试成为媒体焦点，但技术领导者的考量远不止于此。选择一个AI平台是对整个生态系统的投入，影响从核心计算成本到代理开发策略、模型可靠性及企业集成等多个方面。但也许最显著的区别，虽然表面上并不明显，却有深远的长期影响，体现在这些AI巨头所依赖的硬件经济结构上。凭借其定制化硅片，谷歌具备显著的成本优势，可能以OpenAI依赖Nvidia市场主导（且高利润率）GPU成本的一小部分运行其AI工作负载。

这项分析超越了基准测试，对比谷歌和OpenAI/微软AI生态系统，企业需考虑的关键因素包括计算经济学的巨大差异、构建AI代理的不同策略、模型能力与可靠性的重要取舍以及企业适配性和分布的实际状况。该分析基于本周早些时候我与AI开发者山姆·维特韦恩进行的深度视频讨论。

**1. 计算经济学：谷歌的TPU“秘密武器”与OpenAI的Nvidia税**

谷歌的一大优势，也是常被忽略的优势，便是其“秘密武器”：长达十年对定制张量处理单元（TPU）的投资。OpenAI和广泛市场严重依赖Nvidia强大但昂贵的GPU。相比之下，谷歌自行设计并部署了自己的TPU，例如近期发布的Ironwood一代，用于其核心AI任务。这包括训练和提供Gemini模型。这带来了巨大的成本差异。

Nvidia的GPU毛利率惊人，分析师估算H100等数据中心芯片及即将推出的B100 GPU毛利率约为80%。这意味着OpenAI（通过Microsoft Azure）需支付高昂的“Nvidia税”。虽然Nvidia制造GPU的成本约为3000-5000美元，但超大规模供应商如微软（向OpenAI供货）批量采购时，每单位价格高达20000-35000美元以上。行业对话与分析显示，谷歌可能仅以高端Nvidia GPU采购成本的约20%获得其AI计算能力。虽然具体数据属于内部机密，但暗示谷歌在硬件层面每单位计算能力的成本效率优势可达4至6倍。

这种结构优势体现在API定价上。比较旗舰模型，OpenAI的O3输入令牌的价格约为Google的Gemini 2.5 Pro的8倍，输出令牌的价格约为4倍。这种成本差异并非只是理论上的，这具有深远的战略意义。谷歌能以更低的价格提供更高的“每美元智能”，为企业提供更可预测的长期总拥有成本（TCO）。这正是它当前正在实践的做法。同时，OpenAI的成本与其Azure交易条款密切相关。确实，计算成本占OpenAI 2024年预计90亿美元运营费用的55%-60%，预计到2025年随着规模扩大将超过80%。尽管OpenAI的收入增长潜力巨大，据内部预测显示，可能到2029年达到1250亿美元，但管理这笔计算支出仍是关键挑战，推动其开发定制硅片。

**2. 代理框架：谷歌的开放生态系统方法与OpenAI的集成方法**

除硬件外，这两家巨头在构建和部署有望实现企业工作流自动化的AI代理方面采取了不同的策略。谷歌明确推动互操作性并构建更开放的生态系统。两周前在Cloud Next大会上，谷歌推出了代理到代理（A2A）协议，旨在使不同平台构建的代理能够通信，还推出了代理开发工具包（ADK）和代理空间枢纽，用于发现和管理代理。尽管A2A推广面临障碍，关键参与者如Anthropic尚未加入，VentureBeat就此联系了Anthropic，但Anthropic未予置评，一些开发者质疑其必要性，认为与Anthropic现有模型上下文协议（MCP）相比。

谷歌的意图显而易见：培育多厂商代理市场，可能在其代理花园内或传闻中的代理应用商店中托管。相反，OpenAI似乎专注于创建功能强大的、工具导向的代理，在其自有堆栈内紧密集成。新发布的O3模型体现了这种策略，能在单一推理链中调用数百次工具。开发人员借助响应API和代理SDK，以及类似新的Codex CLI这样的工具，构建在OpenAI/Azure信任边界内的复杂代理。虽然类似微软Autogen的框架提供了些许灵活性，但OpenAI的核心战略似乎更注重在受控环境内提升代理能力。

企业启示：优先考虑灵活性并能灵活组合不同供应商的代理，例如将Salesforce代理接入Vertex AI的企业可能会觉得谷歌的开放方法更具吸引力。那些深度依赖Azure/Microsoft生态系统或偏好更垂直化管理、高性能代理堆栈的企业可能会倾向OpenAI。

**3. 模型能力：一致性、性能和痛点**

快速发布周期意味着模型领导地位稍纵即逝。尽管在某些编码基准测试（如SWE-Bench Verified和Aider）上，OpenAI的O3目前略占优势，但在其他基准测试（如GPQA和AIME）上，Gemini 2.5 Pro表现相当甚至更优。Gemini 2.5 Pro还在大型语言模型（LLM）竞技场排行榜上处于领先地位。

但对于许多企业应用场景而言，这些模型在核心能力上已基本持平。真正的差异在于它们各自的平衡点：

– **上下文长度 vs. 推理深度**：Gemini 2.5 Pro 拥有巨大的 100万标记的上下文窗口（计划扩展到 200万），非常适合处理大规模代码库或文档集合。而OpenAI的O3提供了20万的窗口，但注重单次交互中的深度工具辅助推理，这得益于其强化学习方法。
– **可靠性 vs. 风险**：这是日益重要的差异化因素。尽管O3展示了令人印象深刻的推理能力，但OpenAI自己的O3模型卡显示它出现幻觉的情况明显更多（是O1在PersonQA上的两倍）。一些分析认为这可能源于其复杂的推理和工具使用机制。Gemini 2.5 Pro虽然有时可能被认为在输出结构上不够创新，但用户常常描述它是企业任务中的更可靠和可预测的选择。

企业必须权衡O3的前沿能力与已知的幻觉风险上升之间的关系。企业要点：“最佳”模型取决于任务。对于分析大量上下文或优先考虑可预测输出的任务，Gemini 2.5 Pro占据优势。对于需要最深层次多工具推理的任务，可以谨慎管理幻觉风险，O3是一个强有力的竞争者。正如山姆·维特韦恩在我们的深度播客中指出的那样，在特定的企业用例中进行严格的测试是必不可少的。

**4. 企业适配与分布：集成深度 vs. 市场覆盖**

最终，采用程度往往取决于平台是否能轻松融入企业的现有基础设施和工作流程。谷歌的优势在于对现有谷歌云和Workspace客户的深度集成。Gemini模型、Vertex AI、Agent Space和工具如BigQuery等被设计为无缝协作，为企业已经投资于谷歌生态系统提供统一的控制平面、数据治理以及潜在更快的价值实现时间。谷歌正在积极吸引大型企业，展示与像Wendy’s、Wayfair和Wells Fargo这样的公司的部署案例。

通过微软，OpenAI拥有独一无二的市场覆盖范围和易用性。ChatGPT的巨大用户群（约8亿月活跃用户）带来广泛的认知度。更重要的是，微软正积极将其最新的O系列OpenAI模型嵌入到随处可见的Microsoft 365 Copilot和Azure服务中，使强大的AI功能能够便捷地提供给数亿企业用户，通常是在他们每天使用的工具中。

对于那些已采用Azure和Microsoft 365的组织来说，采用OpenAI可以是一个更自然的延伸。此外，开发人员广泛使用OpenAI API意味着许多企业提示和工作流已经针对OpenAI模型进行了优化。

战略决策：选择往往归结为现有的供应商关系。谷歌为其现有客户提供了一个吸引人的整合方案。由微软的分销引擎支持，OpenAI为众多以微软为中心的企业提供了广泛的易用性和潜在更容易的采用方式。

谷歌与OpenAI/微软之间的生成式AI平台之争已经远远超出了简单的模型比较。虽然两者都提供了最先进的能力，但它们代表着不同的战略赌注，并为企业带来了独特的优劣势。

选择往往归结为现有的供应商关系。谷歌为其现有客户提供了一个吸引人的整合方案。由微软的分销引擎支持，OpenAI为众多以微软为中心的企业提供了广泛的易用性和潜在更容易的采用方式。

企业必须权衡在代理框架上的不同方法，模型能力之间微妙的平衡点，例如上下文长度与前沿推理，以及企业集成和分布覆盖的实际问题。然而，笼罩在所有这些因素之上的现实是计算成本，这可能是最关键且定义长期差异的因素，特别是如果OpenAI不能迅速解决这个问题的话。

谷歌垂直整合的TPU策略，使其有可能绕过嵌套在GPU定价中的约80%的“Nvidia税”，这对OpenAI造成了负担，这代表了一种根本性的经济优势，可能具有颠覆性的影响。这不是一个小的价格差异；它影响从API的可负担性到长期总拥有成本（TCO）的可预测性，再到AI部署的规模。随着AI工作负载呈指数级增长，拥有更可持续经济引擎的平台——由硬件成本效率驱动——将拥有强大的战略优势。

谷歌正在利用这一优势，同时推动代理互操作性的开放愿景。由微软的规模支持，OpenAI则以深度集成的工具使用模型和独一无二的市场覆盖作为回应，尽管对其成本结构和模型可靠性仍存在疑问。

为了做出正确的选择，企业技术领导者必须突破性能指标限制，根据这些生态系统的长期TCO影响、他们对代理策略和开放性的偏好、他们对模型可靠性风险与原始推理能力的容忍度、他们的现有技术栈及其特定应用需求来评估这些生态系统。

观看山姆·维特韦恩和我分解内容的视频：每日业务用例洞察VB日报

如果你想给老板留下深刻印象，VB日报会为你提供帮助。我们会告诉你公司如何使用生成式AI，从监管变化到实际部署，以便你可以分享洞见以实现最大价值。立即订阅阅读我们的隐私政策感谢订阅。查看更多VB新闻通讯。发生错误。

(以上内容均由Ai生成)