仙林踪视频老狼欢迎您,GoogleIO2026:模型【不再】是主角,智能体[撑起]AI《商业》化-兴和县振泓遥百货店

GoogleIO2026:模型【不再】是主角,智能体[撑起]AI《商业》化

2026-05-20 17:34:45 烟雨江南 点精灵 / 逆苍天

拼参数的模型时代已过去,接下来是拼生意的智能体时代。

5 月 20 日,美国加州山景城,Google CEO Sundar Pichai 又一次走上 Google I/O 的舞台,掌声热烈。

今年他却没有像往年那样,一上来就亮出新模型。他先亮里一组数据展示 Google 过去一年的成果。Gemini App 达到 9 亿月活、AI Mode 达到 10 亿月活的、 Workspace 的用户突破 40 亿用户、每月 token 的处理量达到 3.2 千万亿。

但讲到产品,首先出场的居然是地图、YouTube、Docs 三个基础应用的 AI 升级,Ask for Maps、Ask YouTube 和 Docs Live。

这个开场顺序很反常。

了解谷歌 I/O 节奏的人都知道,过去三年 Google 总是从模型能力开场。它得向世界证明,它没被 ChatGPT 甩下。2023 年 Bard 急匆匆登场,2024 年 Gemini 反复改名重启,2025 年它终于追平节奏。那三年,Google 越发力越像 OpenAI,越用力越不像自己。很明显,这一次,Google 的叙事姿态变了,Sundar 不再焦虑,开始回到用规模说话,讲述 AI 进入自家产业细微处所带来的变化。

如果你按「发布了什么」看这场 I/O 大会,会看到一堆新东西:Gemini 3.5 Flash、世界模型 Gemini Omni、个人智能体 Gemini Spark、智能购物车 Universal Cart ……

但如果换一个视角,你会发现另一件事,Google 正在系统性地把 AI 的每一处可能性都改造成商业入口。

Google 3.5 Flash 在打模型价格战,Gemini Spark 是新的订阅增长动力,智能购物车 Universal Cart 可以收电商佣金,UCP 在协议层抽水,Workspace 智能体服务企业,Chrome agent 则是重做搜索广告这门老生意。

这背后当然有资金的压力,Google 宣布今年要花 1900 亿美元继续投入 AI 基建,是 2022 年的 6 倍。但更值得关注的是,Google 用一条全新的产品线在回答一个问题,当模型本身越来越不值钱了,AI 真正的商业化,要从哪儿开始?

01

Gemini 4 缺席

Google 这次没把模型当重点

这次 Google 在 I/O 大会上一共带来了三款新模型:Gemini 3.5 Flash、Gemini Omni 、Gemini 3.5 Pro。

其中,Gemini 3.5 Flash 的输出速度比其他模型快 4 倍,在 Antigravity 开发者平台里跑甚至能快 12 倍。谷歌技术人员还在台上演示了一个 demo,让 Gemini 3.5 Flash 实时生成一段 Chrome Dino 游戏代码,屏幕右上角的 token 输出速度跳到了每秒 1500 个 token。

性能上,Gemini 3.5 Flash 在几乎所有 benchmark 上都拿到了 曾经高端模型 Pro 级别的成绩,代表智能体执行能力的 Terminal-Bench 2.1 拿到 76.2%、代表工具调用的 MCP Atlas 拿到 83.6%、代表多模态推理能力的 CharXiv Reasoning 拿到 84.2% 。

价格上,Gemini 3.5 Flash 定价每百万 input token 1.5 美元、每百万 output token 9 美元。这这个价格放在中端模型里,性价比相当高。对标的 Claude Sonnet 4.6 是每百万 input 3 美元、output 15 美元,Gemini 3.5 Flash 整体便宜了 40-50%。目前 Gemini 3.5 Flash 可以在 Gemini App 和 AI Mode 中直接体验。

「一家公司每天处理 1 万亿 token,如果把 80% 工作流换成 Flash,一年能省 10 亿美元。」Sundar 说道。很显然,在 Gemini 3.5 Flash 上,Google 已经调整了自己的模型产品逻辑,当大家都在卷模型上限,卷谁的模型 benchmark 更高的时候,Google 觉得够强、够快、够便宜的 Gemini 3.5 Flash 更有市场竞争优势。

这其实很好理解,模型的利润空间已经越来越薄,模型本身正在变成一个「够用就行」的东西,也因此性价比甚至开始比性能更重要。同时,当模型本身越来越便宜,真正能定价的,是模型之上的东西,比如说智能体、订阅、企业服务等等,更具有价值,因此模型开始回归到底层基础建设,为智能体服务。

其次,Google 终于拿出多模态模型的最后一块拼图,世界模型 Gemini Omni。Google 把音频、图片、视频生成能力都放进了 Gemini Omni,据悉下个月能够先体验 Gemini Omni Flash。

介绍 Gemini Omni 的时候,Google DeepMind 联合创始人 Demis Hassabis 主要就用了一句话:「模型从预测文本,到模拟现实(from predicting text to simulating reality)。」

这也意味着 Google 之前拼起来的多模态,比如说做视频的 Veo, 做图像的 Nano Banana,做音乐的 Lyria,Gemini 负责理解和推理方向全在该模型上融合了, Google Gemini Omni 第一次有了模型同时具有理解世界和生成世界的能力。

这也给 Google 打开了一个商业化的新方向。过去 Google 在创作者市场一直是缺席的,Adobe 占着专业创作,CapCut 占着轻量创作,内容创作赛道一直竞争激烈。Google 将 Gemini Omni 的模型能力深度集成进了 Google Flow、YouTube Shorts 和 Workspace 里的 Pics 工具。这意味着 Google 终于有了能切进内容创作市场的有效抓手。

奇怪的是,Google 这次没发 Gemini 4,甚至 Gemini 3.5 Pro 的介绍也就是寥寥几句带过。按行业节奏,Gemini 3 系列推了一年多,Gemini 4 应该是这次谷歌 I/O 最该发的旗舰模型。

对于产品的缺席,产业内一种猜测是前沿模型的发布节奏已经不是 Google 现在最在意的事了。比如说,这次发的所有产品,都不需要「Gemini 4 那种级别的模型」才能跑,Gemini 3.5 Flash 已经够便宜、够快,Gemini Omni 还补上了多模态的理解短板,因此此时端出 Gemini 4,除了参数的变化,意义并不大。

更可能的原因是,Google 现在最想做的事 , 不是再发一个让人惊叹的新模型,而是让现有模型跑出更多产品来挣钱。让前沿模型留在内部继续训,今年这个舞台,Google 留给的不是技术,是商业生态。

02

智能体成为商业化钥匙?

谷歌首推个人助理 Gemini Spark

如果按「模型不再是主角」,那 Google 这次把主角让给了谁?答案显然是智能体。

但智能体这个词,过去一年被各家用得太滥了,OpenAI 在讲、Anthropic 在讲、Microsoft 也在讲。每家说的都不太一样,有的是浏览器里跑代码的工具,有的是 API 里调用的函数,有的就是个「会自己点几下鼠标的 Chat」,似乎沾一点执行都能叫做智能体。

关于智能体定义,其实 Google 也并没有给出比较明确的信息,只是推出了个人智能体助理Gemini Spark,把它放在场景里讲清楚了一些。

「Gemini Spark 是你个人的一个 AI 代理体,帮助你游刃有余地度过你的数字化生活,每天代表你采取一些行动,当然一切听你指挥。」这是谷歌给 Gemini Spark 的定义。

技术上,Gemini Spark 是基于 Gemini 3.5 + Antigravity 框架做底层技术支持。Antigravity 是 Google 在去年 11 月发的智能体开发平台(IDE),内部团队已经用它写过代码。这次 Antigravity 升级到 2.0,变成「agent first」,所有交互都围绕智能体重新设计。

此外,Gemini Spark 还可以通过 MCP 协议接外部工具。本次谷歌宣布首批接的是 Canva、OpenTable、Instacart。这也就意味着,Gemini Spark 不只能在 Google 自己的产品里干活,它能调用第三方应用。

Josh Woodward 在台上演示了几个场景,让 Spark 帮他给团队写一封关于产品发布的总结邮件、帮他规划街区聚会、追踪邻居 RSVP、提醒孩子学校截止日期。这些场景看起来都不「惊艳」,但都有一个共同点,Spark 真的可以帮你做你本来就要做的事。本周 Gemini Spark 开始小范围测试,下周向美国 Google AI Ultra 订阅者开 Beta 测试版。

值得注意的是,把 Google 这次发布的所有公告串起来看,会发现 Spark 不是一个产品,Spark 是一个层。它出现在了 Google 几乎所有重要的入口里。

具体说,Gemini Spark 这次明确落地的场景就有八个,发布会上用了大量演示直观展现了它的能力:

首先是 Gemini App,本周向 Ultra 订阅者开放;然后是 Chrome 浏览器,今年夏天升级成所谓的「agentic browser」,到时候 Gemini Spark 直接在你浏览的网页上替你做事;

比如说,你想换一份新的家庭保险,你可以打开 Chrome 让 Gemini Spark 替你跑。它会自己打开几家保险公司的官网,填好你的信息,把每家的报价、保障范围、免赔额都汇总成一张表给你看 , 你只需要在最后一步确认要不要下单。整个过程你不用切换标签页 , 不用一家家比,甚至不用打开网页。

接着是 Android Halo 中的 Gemini Spark,年底前推出,可以在手机状态栏直接显示 Gemini Spark 正在干什么;还有 macOS 桌面 App,今夏集成 Spark,可以操作你本地的文件;在 Google Workspace 这一档,Gmail、Docs、Slides 等产品里都会嵌入 Gemini Spark,服务各种各样的产品,不过会先在企业客户里预览。

此外,在 Google Search 里,Spark 以「信息智能体」的形式 24 小时在后台替你监控信息;Universal Cart 智能购物车里,Gemini Spark 结合 AP2 协议替你下单付款;最后是 Android XR 智能眼镜,今年秋季首款音频眼镜上市,通过 Gemini Intelligence 还可以调用 Gemini

最新头条

实时推荐