暗黑蘑菇网热门爆料视频,租下22万《颗英》伟达GPU的同一天,Anthropic向(谷歌)TPU承诺了2000{亿美}元-兴和县振泓遥百货店

租下22万《颗英》伟达GPU的同一天,Anthropic向(谷歌)TPU承诺了2000{亿美}元

2026-05-18 23:41:30 黑色尼古丁 周郎羡 / 风雪天心

几天前,硅谷传出消息:谷歌宣布,未来五年要提供给 Anthropic 的算力,规模高达 5GW。紧接着,5 月 6 日,这笔交易的价格被揭开—— Anthropic 承诺未来五年向谷歌云支付约 2000 亿美元,用于采购 5GW 的 TPU 算力和云服务。

同一天,Anthropic 还宣布租下 SpaceX 的 Colossus 1 超级计算机,接入超过 22 万颗英伟达 GPU 用于推理。

5GW 在数据中心行业是什么概念?它大概相当于 5 座大型核电站满负荷运转的耗电量。这意味着谷歌几乎是为了 Anthropic 新建好几座超大规模数据中心,里面塞满几十万块谷歌自己设计的 TPU 芯片。而 Anthropic 为此付出的承诺采购额高达 2000 亿美元,占到了谷歌云积压订单的 40% 以上。

更有意思的是这笔交易的结构:谷歌先向 Anthropic 投入 100 亿美元现金(按 3500 亿估值),若达成里程碑再追加至 400 亿;同时 Anthropic 承诺 2000 亿美元的云服务和 TPU 采购支出。投资是投资,采购是采购,但两者捆绑在一起,构成了极强的锁定效应——芯片被指定为谷歌自研的 TPU。

面对这样一份带有排他意味的超级大单,Anthropic 也顺势调整了自己的算力版图:在训练侧大幅向谷歌 TPU 和亚马逊 Trainium 倾斜,同时仍保留英伟达 GPU 在推理等场景中的角色。5 月 6 日租下 SpaceX 的 22 万颗 GPU,就是 Anthropic 在 GPU 推理侧的最新动作。

对于行业来说,或许,它标志着 AI 产业从 " 参数军备竞赛 " 正式转向 " 算力效率竞赛 " 的拐点,也标志着技术路线正在加速分化。这次切换,正在无声而有力地改变 AI 芯片的权力格局,重新定义了大模型和底层硬件之间的关系。

01 被英伟达 " 卡脖子 " 的痛

要理解 Anthropic 这次的算力布局为什么重要,得先看懂过去两年 AI 算力市场有多残酷。

自从 ChatGPT 横空出世,大模型就变成了一个 " 烧钱无底洞 "。行业里心照不宣的潜规则是:不管你融了多少钱,最后都得变成一张张采购英伟达 H100 或 B200 的订单。英伟达靠着 CUDA 生态的绝对垄断,不光拿走了行业里绝大部分利润,还捏着模型厂商的命脉——黄仁勋给你发多少货,你就能训练多大的模型。

在这种格局下,大模型厂商的大部分利润最终流向了英伟达。

但局中人也不是没有反抗的心思,尤其是那些手里有钱的云巨头:

• 谷歌心里很憋屈:TPU 研发了十多年,一直在内部训练 Gemini,性能其实不差,但缺少外部顶级大模型的 " 背书 ",总被市场当成非主流。

• 亚马逊也很焦虑:作为全球最大的云厂商,AWS 每年要给英伟达交天价保护费。它砸了大钱研发自研芯片 Trainium,急需一个标杆客户来证明 " 不用英伟达也能跑顶级模型 "。

• Anthropic 有点特殊:由 Dario Amodei 等前 OpenAI 核心成员独立创立,主打安全可控。它同时拿着谷歌、亚马逊和微软的钱——谷歌 400 亿美元投资、亚马逊累计 330 亿美元投资,加上 2025 年 11 月签下的 300 亿美元微软 Azure 算力合同,处在一个微妙的三角平衡中。面对高昂的算力成本,它比谁都渴望撕开一个口子,找找算力的 " 平替 "。

英伟达太贵、太慢、太强势;谷歌有芯片但缺生态,亚马逊有钱想要独立,Anthropic 想活下去还要盈利。四方的诉求,在这一刻正好咬合在了一起。一场针对英伟达定价权的多边博弈已经展开。

02 " 用脚投票 ":Anthropic 的算力豪赌

Anthropic 的选择,撕开了高昂算力成本的一角。它的本质,是用硬件的确定性,来换取模型迭代的绝对速度和成本护城河。

谷歌分阶段向 Anthropic 兑现算力承诺,规模预计达到 5GW 级别的 TPU 集群(从 2027 年起逐步上线)。与此同时,谷歌对 Anthropic 的总投资额至多达 400 亿美元,Anthropic 对谷歌云的采购承诺则高达 2000 亿美元。如此体量的算力集群,足以让 Claude 的训练效率大幅跃升,或者让 Anthropic 同时并行推进多个行业大模型的定制。

这些承诺背后,是 TPU 在特定任务上对 GPU 的真实优势:

• 性价比领先:根据 Google 官方数据,在大型 Transformer 模型训练场景下,TPU v6e 的性价比(性能 / 美元)约为同代英伟达 GPU 的 3 到 4 倍。

• 能效提升:Google 数据中心 PUE 约为 1.1,远低于行业平均 1.58,综合运营成本优势明显。SemiAnalysis 的研究报告也指出,Anthropic 的推理基础设施毛利率已从 38% 提升至 70% 以上,定制芯片路线的降本效应可见一斑。

从技术底层来看,Anthropic 早就开始谋求 " 去单一硬件依赖 "。2026 年 3 月,Anthropic 宣布已部署百万颗 Google TPU,下一财年 TPU 算力将达 1GW;在训练侧,TPU 和亚马逊 Trainium 已成为核心算力来源;而在推理侧,英伟达 GPU 仍然扮演重要角色—— 5 月 6 日租下 SpaceX Colossus 1 的超 22 万颗 GPU 就是最新例证。再加上用 JAX 框架对 TPU 集群做底层调优,Anthropic 已经形成了一个 TPU 训练主力 + Trainium 备份训练 + GPU 推理补位的多元算力架构。

可以理解为,这是训练到推理的全栈算力重构。Anthropic 已经用行动证明:大模型厂商不再只是硬件厂商的 " 提款机 ",而是可以成为算力架构的 " 设计师 "。

03 四大阵营贴身肉搏,与一个 " 务实 " 的混合算力方案

Anthropic 的转向,像一条鲶鱼,直接引爆了全球 AI 芯片四大阵营的正面对决。现在的算力江湖,已经不是英伟达一家独大了。

1. 谷歌– Anthropic:垂直闭环的领跑者

"TPU – JAX – Claude" 这条全栈协同的路线,正在结出果实。根据摩根士丹利预测,2027 年 TPU 对外销售有望拿下全球 AI 加速芯片市场 20% 的份额。更可观的是成本竞争力:Claude 系列在同等性能段内的 API 定价,相比部分头部竞品更具优势,谷歌通过硬件降本直接帮 Anthropic 打出了性价比牌。

2. OpenAI:算力堆得猛,兼容性拖后腿

相比之下,OpenAI 正在构建庞大的算力矩阵,已锁定 30.5GW 的长期算力合约。2025 年 10 月,OpenAI 与 AMD 签署多年期协议,部署总计 6GW 的 AMD Instinct GPU 算力(首期 1GW MI450,2026 年下半年部署),与英伟达 GPU 并行组成大规模算力集群。

但这种 " 大杂烩 " 架构付出了不小的代价:多芯片、多厂商导致算力利用率偏低,规模化的红利被沉重的兼容性成本吃掉了。

3. 英伟达:死守基本盘,高端腹地正在被侵蚀

老大哥英伟达依然握着 AI 加速器市场 80% 以上的份额,CUDA 生态还是它坚不可摧的护城河。但 TPU 在大模型核心训练场景里持续渗透,已经让黄仁勋感到了压力。2025 年 7 月,英伟达宣布 CUDA 全面支持 RISC-V 架构——这在以前几乎不可想象,生态壁垒正被 " 定制化需求 " 从内部撬开。

4. 中国阵营:开源适配,换道超车

囿于外部环境,国产 AI 芯片整体市占率逆势提升。根据 IDC 数据,2025 年中国 AI 加速卡市场总出货量约 400 万张,本土厂商合计出货约 165 万张,市场份额首次突破四成,达到约 41%(中国境内市场)。例如 DeepSeek-V4(2026 年 4 月发布)已于官方技术报告中写入华为昇腾 NPU 支持,华为昇腾、摩尔线程等多家国产厂商均完成 Day 0 适配。中国厂商不拼单点极限算力,而是走 " 芯片 + 模型 + 场景 " 的快速落地路线。

格局已经变了:AI 竞争不再是比谁买的卡多,而是 " 算力效率 × 场景适配 " 的综合暗战。

而 Anthropic 精心设计的这套混合算力方案,恰恰指明了下一代 AI 基础设施的主流方向——分工明确、冗余可控、拒绝被单一厂商绑架。这套方案非常精明:

• 5GW 的 TPU 作为训练绝对主力,扛起核心大模型的高强度训练;

• GPU 作为 " 万金油 ",补位推理和多模态数据处理等任务(SpaceX Colossus 1 的 22 万颗 GPU 就是最新落子);

• 亚马逊 Trainium 作为战略备份训练算力池,压低整体边际成本。

这套组合拳带来了几个立竿见影的商业好处:供应链风险大幅降低(不怕被单一供应商卡脖子);Anthropic 于 2025 年 6 月公开的多智能体系统数据显示,以 Claude Sonnet 为主导智能体、多个 Claude Haiku 为子智能体的架构,相比单智能体 Claude Opus,任务性能提升约 90%;更重要的是,硬件级加密结合 Anthropic 引以为傲的伦理框架,让金融、医疗等高敏感行业的客户敢于真正下单。

04 戴上 " 金手铐 " 的 Anthropic

当然,商业世界里没有免费的午餐。Anthropic 这次向 TPU 深度倾斜,在换来极致训练效率和短期成本优势的同时,也给自己悄悄地戴上了一副 " 金手铐 " ——表面金光闪闪,实则勒得越来越紧。

首先,最直接的风险是底层架构的话语权正在旁落。深度绑定谷歌 TPU,意味着 Anthropic 未来的模型优化、算子开发、甚至推理框架的选型,都会被 TPU 的硬件迭代节奏牵着走。谷歌的 TPU 团队每推出一代新芯片,Anthropic 就得跟着重新适配甚至重写部分底层代码。短期看,这是 " 联合优化 ";长期看,这就变成了 " 单向依赖 "。一旦谷歌调整 TPU 的产品路线图——比如某个指令集不再支持,或者某个硬件特性被放弃—— Anthropic 的适配成本和迁移风险将显著上升。

其次,多云协同很容易变成 " 多云约束 "。Anthropic 目前同时踩着谷歌云、AWS 和微软 Azure 三条船,听上去很灵活:TPU 主力训练,Trainium 备份训练,GPU 推理。但在实际操作中,这种跨云架构的维护成本远超想象。

数据要在三个云之间同步、任务调度要兼顾三套芯片的差异、灾难恢复方案要写三份——更别提三家云厂商各怀心思,未来会不会在价格、带宽、优先级上互相掣肘?据知情人士转述,Anthropic 内部对多云架构的运维复杂度早有感受。一旦某天谷歌和亚马逊的关系微妙变化,Anthropic 就会沦为夹在中间的那个。

更隐蔽但更致命的,是技术独立性的慢性流失。Claude 的每一次模型迭代,理论上应该是为了更好的智能和安全性。但未来,如果某个架构改动在 TPU 上跑得飞快、在 GPU 或 Trainium 上却表现平平,产品经

最新头条

实时推荐