真实偷盗拍摄,Cerebras跑赢英伟达21倍，{老黄}还【在北】京吃吃吃-兴和县振泓遥百货店

5 月 14 日上午 9 点 30 分，纳斯达克的电子盘上，CBRS 的开盘价第一个跳了出来：350 美元。

这是 Cerebras Systems 上市发行价 185 美元的 1.89 倍，是 3 个月前 Tiger Global 领投 H 轮融资时 230 亿美元估值的 4 倍，也是 18 个月前阿联酋投资方 G42 持股引爆美国外资审查、招股书被迫撤回时账面估值 40 亿美元的 23 倍。

盘中股价一度冲到 386 美元，收盘报 311.07 美元，全稀释市值约 950 亿美元，单日涨幅 68.2%——成为继 2019 年 Uber 之后美国规模最大的科技公司上市事件（CNBC，2026/5/14）。

Andrew Feldman 这天站在纳斯达克现场。11 年前他把上一家公司 SeaMicro 以 3.34 亿美元卖给了 AMD，敲钟的时候做梦也不敢想这次的数字——一夜之间，他个人持股账面市值越过了 10 亿美元。

同一时刻，英伟达总部里，似乎没有人召集应急会议。

第二天 5 月 15 日，CBRS 高开后一路走低，盘中下探 275 美元，收盘约 280 美元，单日跌 10%（CNBC，2026/5/15）。两个交易日的振幅是 109%，从首日收盘的回吐幅度是 28%。市值 36 小时内从 950 亿美元跌回 850 亿美元区间。

媒体的叙事一边倒地从 "AI 上市潮复苏 " 切换到 "AI 估值泡沫 "。但真正值得追问的不是 Cerebras 的价格，而是英伟达那边为什么没有动静—— Cerebras 的旗舰芯片，第三方测试里推理 Llama 3 70B 模型比英伟达旗舰 GPU B200 快 21 倍（Cerebras 官方 vs NextBigFuture 复测，2026），Feldman 的履历漂亮、产品参数惊人。

讲真，按 "AI 时代的硬件颠覆 " 剧本，老黄应该至少召集一次内部会议。

但他没有。

他还在北京吃，吃得不亦乐乎。

晶圆的诱惑

Cerebras 卖的是 " 算力的奇观 "。

英伟达的 B200 是把多颗芯片用高速互连技术拼起来，每颗芯片 2080 亿个晶体管。Cerebras 反其道——把整张 12 英寸晶圆当成一颗芯片用。

一张晶圆通常会被切成几百颗 GPU，Cerebras 不切，整张做成单芯片，叫做 " 晶圆级芯片 "（Wafer Scale Engine，简称 WSE）。

第三代 WSE-3 单片集成 4 万亿个晶体管、90 万个计算核心、44GB 片上高速缓存、5 纳米制程，是地球上现存最大的单芯片。

这两条技术路线的差距，集中在内存带宽这一个核心指标上：

简单翻译技术语言就是：英伟达的体系最贵的那一段，是显存和芯片之间的数据搬运——一颗 GPU 装不下整个模型，所以需要不停地把权重从外部高带宽显存（HBM3e）搬到计算核心去用，搬运速度越快、推理越快，于是英伟达每年砸最多的钱在显存升级和高速互连上。

Cerebras 直接绕开了这道坎——它把整个模型权重塞进 44GB 的片上缓存，根本不需要搬运，计算核心就在权重旁边。所以在跑 70B 到 405B 量级的模型时，单台 Cerebras 系统的吞吐量比一台装 8 块英伟达 B200 的服务器还高。

这是技术意义上的奇观。Feldman 把 11 年前在 SeaMicro 做 " 高密度微型服务器 " 的逻辑（同一套人马）放大到了 AI 芯片—— SeaMicro 当年以 3.34 亿美元卖给 AMD 时，AMD 给的判断是 " 微型服务器路线赌错了 "，5 年后产品线被关停。Feldman 这次把 " 集成度极限 " 的玩法换了个赛道做了一遍。

但这里有个关键前提藏在 Cerebras 自家白皮书最末页的但书里：

" 如果跑的模型装不进单张晶圆，性能会远远差于带高速互连的英伟达 B200 和 B300 系统。"（NextBigFuture 复测原文）

总的来说，模型必须能装进一张晶圆才能跑得快。44GB 片上缓存听起来很大，但 GPT-4 量级（1.8 万亿参数）、Llama 3.1-405B、Grok 3 这种参数规模的前沿模型，要么需要切分到多张晶圆上（损失了 " 全在片上 " 的优势）、要么需要走晶圆和晶圆之间的链路（损失了 " 省掉外部显存搬运 " 的优势）。

Cerebras 的 21 倍速度优势成立的工作负载，集中在 70B 到 405B 的中型模型推理 + 科学超算仿真——这是个真实的市场，但不是英伟达在的那个市场。

英伟达 2026 财年第四季度单季的数据中心收入是 623 亿美元（计算业务 513 亿 + 网络业务 110 亿），同比增长 58%。Cerebras 2025 年全年总营收是 5.1 亿美元（招股书，Tom's Hardware 转引）。两个数字的倍数关系是 122 倍——而且英伟达这 623 亿里，没有任何一个工作负载是 Cerebras 能完整替代的：

•训练：超大模型训练需要数千卡互联，Cerebras 的晶圆间链路成熟度远远不够；

•推理：Cerebras 只能打中型模型，前沿模型（GPT-5、Claude Opus 4.7、Gemini 3.1 Ultra）跑不进 44GB；

•多模态 / 视频生成：需要高速互连配合大显存；

•客户多样性：B200 装在亚马逊、微软、谷歌、甲骨文四朵公有云里，每家自己的工作负载都不一样。

Cerebras 在中型模型推理这块确实赢了。问题是这块占英伟达数据中心收入的 5%-8% ——老黄一个季度的零头。

阿布扎比的房间

Cerebras 的招股书中藏着一组比技术更扎眼的数字：

表面上 G42 的占比从 85% 降到 24%，但 G42 把订单 " 分账 " 给了关联方 MBZUAI ——这是 G42 控股的研究型大学，2025 年 62% 营收来自这一家。两者合并仍是 86%，实际上是同一个客户用两个壳付钱。

更要命的是 MBZUAI 一家占应收账款 77.9%。换句话说，Cerebras 不仅在赚阿联酋的钱，连账期都押在阿联酋身上。

美国外资投资委员会 2024 年 9 月之所以让 Cerebras 撤回第一版招股书，就是因为 G42 持有 Cerebras 投票权股份，触发了 " 国家安全审查 "。

直到 G42 把持股改为非投票权（2025 年 10 月），Cerebras 才能重新进入上市流程。Cerebras 的客户和股东曾经是同一家阿布扎比公司——这种结构在传统二级市场会被打 30%-40% 估值折扣。

英伟达的客户结构是另一个极端：2024-2025 年它的数据中心收入里没有任何单一客户超过 13%（年报披露），微软、Meta、亚马逊、谷歌、甲骨文、特斯拉、xAI、Anthropic（5 月 6 日刚把 Anthropic 加进来，整租了 Musk 在田纳西州孟菲斯建的算力中心）排排坐。

Blackwell GPU 的在手订单是 360 万台，售罄到 2026 年中（Yahoo Finance，2026）。老黄上一次电话会议给出的判断是：Blackwell + Rubin 两个世代累计收入将达到 1 万亿美元（2025-2027 三年）。

把 Cerebras 的 86% 阿联酋集中度和英伟达 " 全球公有云 + 全球前沿实验室 " 的客户矩阵放在一起，你就懂老黄为什么不开会：Cerebras 在跑的赛道，英伟达不仅没在跑，而且不打算去跑。

中东主权基金的 AI 算力采购，2024-2026 年是一个真实的需求池（沙特公共投资基金 + 阿布扎比穆巴达拉 + G42 加起来公开承诺的 AI 基础设施投入超过 5000 亿美元），但这是个由政治订单驱动的市场，不是技术性能驱动的市场。MBZUAI 选 Cerebras 不是因为速度快 21 倍，是因为 G42 是 Cerebras 股东、Cerebras 是 G42 的国家级 AI 工程合作伙伴。这种关系一旦因为地缘政治翻车——美国二次审查、Trump 中东政策转向、阿联酋倒向中国 AI 供应链——Cerebras 86% 的营收会在一个季度内蒸发。

而英伟达没有这个风险。它的客户分散度足以吸收任何单一客户、单一地区、单一应用的崩溃。

CUDA 的院墙

Cerebras 撼不动英伟达的最后一道墙，叫 CUDA。

CUDA 是英伟达 2007 年开始推的 GPU 编程平台——所有用 GPU 跑深度学习的代码，必须先用 CUDA 写、用 CUDA 编译、调用 CUDA 的算子库。英伟达过去 18 年的真正护城河，从来不是 GPU 性能，是这套 CUDA 软件生态。

说白了，过去 15 年里，AI 圈写代码这件事默认就是写 CUDA。PyTorch、TensorFlow、JAX、vLLM、DeepSpeed、Triton ——所有主流深度学习框架的底层默认假设是英伟达硬件。300 万开发者已经把 "AI = CUDA" 内化成肌肉记忆。这不是性能能解决的事，是迁移成本能不能承受的事。AMD 用 MI300X 砸了 4 年自家生态，目前的现实是 AMD 拿到了 5%-7% 的市场，剩下 90%+ 还在英伟达手里。

Cerebras 比 AMD 更难，因为它根本不是 GPU 架构。晶圆级芯片用的是 " 数据流 " 架构，不能直接跑 CUDA 代码，必须用 Cerebras 自家的开发工具。一个客户从英伟达迁到 Cerebras 不是写几个接口适配，是要把整套训练和推理流程重写一遍。

MBZUAI 愿意这么做，是因为它本来就是 Cerebras 的合作伙伴，没有历史包袱。但任何一家已经在英伟达上跑了 2 年模型的公司——微软、Meta、Anthropic、xAI、OpenAI ——都不会做这个迁移。

老黄过去几次财报会议反复强调一个观点：" 英伟达是一家软件公司，顺便做芯片。"（"NVIDIA is a software company that happens to build chips."）从财务结构上看这话是真的：英伟达数据中心收入里网络业务 + 软件业务的占比正在快速上升，2026 财年第四季度网络业务单项收入 110 亿美元，同比 +263% ——这部分跟 GPU 算力没关系，是生态税。

Cerebras 卖的是快 21 倍的飞机，英伟达卖的是机场 + 油料 + 维修 + 飞行员培训 + 空中交通管制。当一家航空公司可以选 " 快 21 倍但只有一个机场可以起降 " 或者 " 普通速度但全球任意机场 " 时，它会选哪个，老黄心里跟明镜似的。

所以老黄为什么不慌这件事，到这里就讲完了。

赛道不重合—— Cerebras 赢的是中型模型推理和超算仿真，占英伟达数据中心收入 5%-8%，老黄的训练、多模态、前沿模型推理三大主业，Cerebras 进不去。客户不重合—— Cerebras

Cerebras跑赢英伟达21倍，{老黄}还【在北】京吃吃吃

猜你喜欢

最新头条