WRITE AS 堵住,最强大[模型],【保质】期越来越《短了》-兴和县振泓遥百货店

最强大[模型],【保质】期越来越《短了》

2026-05-19 04:20:18 郁雨竹 玛索 / 韦贝贝

文 | 深流研究所,作者 | 绛枫

最近,AI 行业引人瞩目的一幕,发生在资本市场。

二级市场交易中,Anthropic 的报价一度突破 1 万亿美元,隐含估值首次超过 OpenAI。一年前,两者的融资估值还相差近 10 倍,OpenAI 仍是几乎没有争议的行业王者。如今,王者之位已经轮替。

这并不是某一家公司单独的起落,而是整个 AI 行业竞争节奏变化的缩影。过去一年,从模型榜单到用户口碑,再到资本定价,Google、OpenAI、Anthropic 这些头部 AI 公司,轮流站上过" 最强 "的位置。

被看衰的公司,可能在几个月后重新回到第一梯队;备受追捧的公司,也可能在登顶后很快迎来质疑。「深流研究所」初步统计,从 " 被追捧 " 到 " 被审视 ",2023 年前后,完成这样一个周期大约是 12-18 个月,现在已缩短到 3-6 个月。

领先开始变得难以维持,轮转还在继续加快。至于为什么会变成这样,才是这场竞争真正值得关注的部分。

六次易主、三轮反转," 最强 " 的保质期越来越短了

2025 年至今,LMArena 排行榜上" 最强模型 "的位置已至少换了 6 次。从 Grok、Gemini、GPT 到 Claude,四家轮流登顶。

过去,一次领先还能维持几个月。到了 2026 年初,这个周期已经被压缩到不足一个月。类似的快速切换,也发生在公司口碑、市场份额和资本信号上。

Google 的变化最先被感知到。2023 年 Bard 首发翻车,2024 年 AI Overviews 又给出荒诞回答,它一度被视为" 大公司病 "的代表。转折发生在 2024 年底。Gemini 团队并入 DeepMind,由 Hassabis 统一管理,Google 的 AI 研发力量被重新整合。

此后,Google 的节奏开始恢复。2025 年 9 月,Gemini 登顶 App Store,首次在移动端压过 ChatGPT;11 月 Gemini 3 发布后,"Google 逆袭 "开始成为主流叙事。母公司 Alphabet 年内股价上涨近 70%,市值重新超过微软。从组织重整到重回第一梯队,Google 用了 12 个月。

OpenAI 的变化更能说明问题。2025 年上半年,它还是不可动摇的王者:ChatGPT 周活达到 7 亿,移动端份额 69%。去年 8 月,GPT-5 发布失利成为转折点。直播出错、模型宕机,社区掀起" 还我 GPT-4o"运动。此后,OpenAI 的移动端份额以月均 2.2 个百分点的速度下滑,到 2026 年初降至 45%。

今年以来,OpenAI 开始战略收缩。Sora 视频生成、硬件等副线被砍掉,资源重新集中到编程工具和企业市场。如今,它从一家什么都想做的超级实验室,变成一家必须证明商业回报的公司,被市场重新审视。

Anthropic 则是这一轮变化中节奏最快的公司。2025 年下半年,Claude 在编程和企业工作流里快速建立口碑,成为开发者圈子里事实上的首选。

进入 2026 年后,Anthropic 又进入一段罕见的密集发布期。12 周内,它完成了近 20 次重大产品更新。密集发版直接推高了业绩:Anthropic 官方披露其年化收入突破 300 亿美元,创下新高;四个月前,这个数字还不到 90 亿美元。

融资曲线上,从 2024 年到 2026 年初,Anthropic 追赶 OpenAI 的速度在加快。

OpenAI 估值仍在创新高——最新一轮投后估值达到 8520 亿美元,但二级市场已经出现约 10% 的折价。今年 4 月,6 家机构试图通过 NextRound 出售合计约 6 亿美元的股份,甚至出现了滞销情况。

反观 Anthropic,估值从 2025 年 3 月的 615 亿美元飙升至 2026 年 2 月 G 轮的 3800 亿美元。更关键的是二级市场:投资者排队抢购,报价一度突破 1 万亿美元,较 G 轮溢价超过 160%,隐含估值已经反超 OpenAI。

Anthropic 登上口碑王座不久,口碑就已开始回调。最近几周,Anthropic 接连被曝出算力不足、在未通知用户的情况下悄悄降低默认推理深度等问题,用户投诉集中爆发,Fortune 也用长篇报道揭开了内部压力。Claude 从" 最值得信赖的 AI"到" 透明度受质疑 ",只用了不到两个月。

从 Google 的逆袭,到 OpenAI 的份额流失,再到 Anthropic 的快速上升和随之而来的信任危机,看上去这些公司每一次转向,都有自己的直接原因。真正值得问的是:为什么" 领先 "本身,越来越难维持?

模型在基础设施化,技术不再是唯一护城河

模型迭代的逻辑已经变了。

2023 年,AI 公司还在按" 大版本制 "发布模型。GPT-3.5 到 GPT-4 间隔 15 个月,Claude 2 到 Claude 3 间隔也接近一年。每次发布都是行业大事,一个版本足以定义一整年的竞争格局。

到了 2025 年,这个节奏被打破了。GPT-5 发布后的 7 个月里,OpenAI 连续推出 5.1、5.2、5.3、5.4 四个大版本及多个子版本,最短间隔不到一周。Anthropic 5 个月内发了至少 5 个版本。

过去 16 个月,OpenAI、Anthropic 和 Google 合计完成了超过 40 次重大模型发布,平均每 3 周发布一次大版本模型。模型迭代从" 攒大招 ",变成" 小步快跑 "。

模型也不再是一款单品。2023 年的 GPT-4 仍是单一旗舰模型。到了 2025 年,GPT-5 系列已经分化出 Instant、Thinking、Pro、Codex、Mini 五个版本,分别覆盖轻量对话、深度推理、编程等不同场景和不同成本带。

Anthropic 和 Google 也都走向了多档位产品矩阵。模型越来越像操作系统,持续迭代、分层供应、按需调用。

这背后是产业逻辑在发生改变。首先是预训练的边际收益在下降。花一年从头训练一个更大的模型,换来的性能提升,可能只剩几个百分点,这已很难支撑 " 攒一个大版本再发布 " 的节奏。

相反,微调、推理优化等后训练手段越来越成熟,同一个底座可以不断迭代出新性能,不必重新训练也能做出代际升级。与此同时,推理成本 3 年下降约 1000 倍,开源与闭源的差距缩小到 1.7%。追赶者的起点更高了,领先者的窗口更短了。

更关键的是,头部公司都在完善训练模型的基建。OpenAI 收购训练基础设施公司 Neptune,又和 Cerebras 签下 3 年、总额超过 200 亿美元的芯片协议,开始降低对英伟达的单一依赖;Anthropic 依靠 Constitutional AI,让 AI 参与训练 AI,大幅提升后训练效率;Google 从 TPU 第七代,到 JAX,再到推理服务,几乎把整条链路都握在自己手里。

底层越扎实,上层迭代就越快。这使得过去需要一年做完的模型升级,现在更短的时间就能完成。

一旦模型基础设施化,一次模型发布的领先或落后,就不再决定胜负。单一维度上的技术领先,也越来越难转化为持久优势。

这也是为什么,过去被认为 " 节奏慢了 " 的大公司,也有机会靠组织纵深、生态积累、持续发力完成反转。

Meta 就是最新的例子。2025 年上半年,Llama 4 因刷榜争议口碑跌到谷底。之后,Meta 投入 143 亿美元收购 Scale AI、挖来创始人 Alexandr Wang,并把 AI 部门重组为" 超级智能实验室 "。仅用 9 个月,它就重建了技术栈。2026 年 4 月发布的 Muse Spark,也一改此前的开源路线,转向把闭源模型嵌入 Meta 自有产品生态。

类似的逻辑也在国内上演。腾讯混元过去一年经历了人员调整和方向摸索后,将研发力量收拢,重建了从预训练到强化学习的基础设施。Hy3 preview 是重建后跑出的第一个模型,目前已上线元宝、CodeBuddy、workbuddy、 ima、腾讯新闻、和平精英等十余个腾讯产品。

一个值得注意的细节,Hy3 preview 的预训练、后训练等环节是并行推进的,这也加快了 Hy3 preview 模型的训练进程。更为重要的是,整个基建和底座搭建完成,混元后续更多模型也将这套基建上启动训练,实现更快迭代。

从性能表现看,Hy3 preview 是一个总参数 295B、激活 21B 的 MoE 模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现大幅提升。混元团队给这款模型的定位也很清晰——能力体系化、评测真实性、性价比。

Hy3 preview 模型在腾讯内部编程、深度研究等业务评测表现稳定,推理效率较上一代提升约 40%,首 token 延迟降低 54%,端到端时长降低 47%,成本较上一代模型大幅下降。这意味着,跟用户体验和落地可行性相关的核心指标均被大幅优化。

同一时间,GPT-5.5 和 DeepSeek-V4 相继发布。DeepSeek-V4 主打 " 交付质量接近 Claude Opus 4.6 非思考模式 " 的性价比,而非跑分登顶;GPT-5.5 虽仍是 OpenAI 的旗舰,强调的也不是智能上限,而是 " 为真实工作而设计 "。

三款模型,共性清晰:不再比拼参数和榜单,而是围绕 Agent、编程交付、长上下文和单位任务成本做深化,评测标准也从公开基准转向真实场景。这正是 " 模型基础设施化 " 的直接体现。

竞争维度在扩展,优势不再集中在一家公司

模型之外,产品战场同样战况激烈。过去一年多,仅 OpenAI、Anthropic 和 Google 三家,就完成了超过 40 次非模型级的重大产品发布。

三家的打法并不一样。OpenAI 铺得最广,Agent、编程、办公集成和消费端同时推进;Anthropic 最聚焦,仅今年 2 月到 3 月的 52 天里,这家公司就密集推出了 74 款大小产品更新,大部分围绕编程和企业工作流纵深突破;Google 没有从零做新入口,而是把 AI 能力持续嵌入搜索、办公和内容产品。

尽管方向不同,但这些密集布局背后有一个共同的驱动力:当模型能力越来越接近,谁更快把模型接进真实场景,谁就更容易成为用户的默认选择。

Agent 范式的出现,又把这个趋势往前推了一步。AI 不再只是回答问题,而是开始调用工具、执行多步骤任务,直接完成一整条工作流。这意味着,只有好模型已经不够了,还得匹配稳定的执行环境、成熟的工具链、可靠的安全机制,以及把这些东西真正串起来的工程能力。

OpenAI 为此搭建了 Apps SDK 和 AgentKit,试图让开发者更快构建可调用外部工具的 AI 应用;Anthropic 推出 MCP 协议和 Computer Use,前者统一了 AI 与外部数据源的连接方式,后者让 Claude 可以直接操作电脑完成任务。

在国内,OpenClaw 今年 3 月爆火后,大厂的 Agen

最新头条

实时推荐