拖?????摸??91,Google瞧不上Harness:发更强TPU搞Agent全家桶,(还随)手替苹果发布【了新】Siri-兴和县振泓遥百货店

Google瞧不上Harness:发更强TPU搞Agent全家桶,(还随)手替苹果发布【了新】Siri

2026-05-18 14:21:04 懒惰的平凡 旻夜 / 华赛永恒

" 试验阶段结束了。" Google Cloud CEO Thomas Kurian 在开场不到三分钟就抛出这句话。

Google Cloud Next 大会于当地时间 4 月 22 日上午在拉斯维加斯召开。这是近年来科技圈最受关注的云计算大会之一,今年的主角只有一个:Agent。

从 Keynote 的章节命名就能看出 Google 的野心:Agentic Enterprise Blueprint、Agentic Data Cloud、Agentic Defense、Agentic Taskforce...... 每一个模块都冠上了 "Agentic" 的前缀,Google Cloud 向世界介绍的是一套从算力底座到应用前端的完整 agent 架构。

但如果你把这场 Keynote 从头看到尾,会发现一件非常有意思的事:

Google 是真的瞧不上 Harness,在整场大会里对这个火热名词一字未提。

在热火朝天的 agent 浪潮里,Harness 是最近一段时间最火热的概念。它被用来描述建设 agent 的过程里所需要的一切基础设施。

而在疯狂的讨论里,如我们之前所观察的,Google 的沉默振聋发聩。它完全缺席了。

这次 Google Cloud 的大会上,缺席的原因终于明白:

Google 根本不认同什么 Harness,或者说它拒绝被其他人提出的模棱两可概念牵着鼻子走,它提出的是从 AI Hypercomputer(包括新发布的训练和推理分家的更强 TPU),Agentic Data Cloud、Agentic Defense、Agentic Task Force,到最重要的 Gemini Enterprise Agent Platform 的 Agent 五层架构体系。

它要用这个全家桶抢走所有企业 agent 的生意。在这次大会上,甚至出现了活久见的一幕:苹果的 logo 出现在 Google 的发布会大屏幕上,恍惚以为误入乔布斯剧院。Google 就这样以客户案例展示的形式 " 发布 " 了新的 Siri 的关键信息。

这一切都是 Google 在秀肌肉。

以下是这场长达两小时 Keynote 的核心内容解析。

Sundar Pichai :资本投入创历史

Google CEO Sundar Pichai 公布了一个让人瞠目的数字:Google 在 2022 年的资本支出为 310 亿美元,而 2026 年的预算区间是1750 亿至 1850 亿美元,四年内实现了近 6 倍的增长。其中超过一半的机器学习算力将专门分配给云业务。

他随即用 Google 自己的案例说明 Agent 的实际价值:

Google 内部目前75% 的新代码由 AI 生成,并由工程师审核通过(去年秋天这一比例还是 50%)。在一次复杂的代码迁移任务中,工程师组建了由 " 规划者、协调者、编码者 " 三类角色构成的 Agent 系统,最终将迁移速度提升了 6 倍。

在营销层面,团队借助 Gemini 生成大量创意素材变体,实现精细化个性投放,带来 70% 的制作周期缩短和 20% 的转化率提升。

在安全层面,Google 安全运营中心的 Agent 每月自动处理数以万计的非结构化威胁报告,将威胁缓解时间压缩了超过 90%。

Pichai 随后宣布了大会最重磅的产品:Gemini Enterprise Agent Platform,并将其定义为 "Agent 时代的任务控制中枢 "。

Gemini Enterprise Agent Platform:企业 Agent 的操作系统

这是整场 Keynote 着墨最多的部分,也是 Google 今年最核心的产品策略落点。

新模型阵容

Google 发布了一批新模型,均处于 Preview 阶段:

Gemini 3.1 Pro,最新的旗舰推理模型,专为复杂工作流编排设计,可与企业 API 和系统直接交互,减少调优需求。Databricks、JetBrains、Replit 均已选择接入。

Gemini 3.1 Flash Image(内部代号 Nano Banana 2),面向高保真视觉资产生成。Veo 3.1 Lite,Google 最具成本效益的视频模型,定位高并发视频应用场景。Lyria 3 Pro,企业级音频和音乐生成模型。

值得关注的是,Google 同时支持 Anthropic 全线模型,并在大会上宣布新增对 Claude Opus 4.7 的支持。

此外,Google 还宣布成为苹果的首选云合作伙伴,双方正在基于 Gemini 技术共同开发下一代 Apple Foundation Models,这些模型将驱动包括 " 更个性化的 Siri" 在内的苹果未来 AI 功能。

Agent 的完整生命周期管理

平台的核心价值在于覆盖 Agent 从构建到治理的全生命周期:

Low-Code Agent Studio 允许非技术员工用自然语言创建和部署 Agent,将业务规则融入 LLM 推理,实现可预期的自主执行。

Agent Registry 是 Agent 的 " 总台账 ",为组织内每一个内部 Agent 和工具建立索引,确保可发现性与治理合规。Skills & Tools Registry 则提供可复用的模块化指令包,让 Agent 能快速习得特定领域的专项能力。

Agent Marketplace 支持从生态合作伙伴直接搜索和部署专业 Agent,接入方包括 Atlassian、Box、Oracle、ServiceNow、Workday 等主流企业软件厂商。

平台原生支持 Model Context Protocol(MCP),并将全部 GCP 服务暴露为 MCP 接口,使任意 Agent 均可无缝调用任意 GCP 服务。

安全与治理:Agent 身份识别

在安全侧,平台引入了 Agent Identity 机制——每个 Agent 被分配唯一的加密 ID 和明确的授权策略,所有行为均可追踪和审计。Agent Gateway 充当统一管控台,跨组织执行策略,配合 Model Armor 防止敏感数据泄露。

Agent Observability 提供粒度化的执行路径可视化,支持 OTel 标准遥测,开发者可追踪 trace、监控工具调用,诊断推理死循环。

真实客户案例

客户采用数据颇为亮眼:

德国保险公司 Signal Iduna 上线数周后即达到 80% 的使用率,11,000 名员工开始自主构建专属 Agent,其健康险 Agent 将用户答复速度提升了 37%,周活用户增长 400%。KPMG 首月达到 90% 的采用率,上线超过 100 个 Agent。Walmart 向门店管理人员推出 Gemini Enterprise,让管理者能花更多时间在卖场与员工、顾客互动,而非坐在办公室盯屏幕。NASA 使用 Gemini Enterprise Agent 为 Artemis II 载人航天任务提供飞行就绪性支持,确保宇航员安全。

此外,Citi Wealth 与 Google Cloud 及 DeepMind 合作,推出了名为 "Citi Sky" 的 AI 财富团队成员,可全天候多语言为客户提供金融服务。Virgin Voyages 部署了面向船员的 AI 助理 "Project Ruby",将生产时间线缩短约 60%,并拉动单月销售额增长 28%,实现了一个销售纪录季度。

大会还邀请了单板滑雪传奇、三届奥运金牌得主 Shaun White 上台,现场演示 Google Cloud 如何用 AI 分析他在 2017 年的比赛影像——将一个不到三秒的腾空动作逐帧拆解,追踪三维姿态、旋转速度、腾空时长,为新生代运动员的技术训练提供数据支持。

AI Hypercomputer:算力基础设施的两条腿

负责基础设施的高级副总裁 Amin Vadhat 说:" 在 Agent 时代,算力不再由一块芯片定义,算力就是整个数据中心。"

第八代 TPU:训练与推理分家

Google 本次发布了 TPU 第八代,并首次拆分为两个独立平台:

TPU 8t(训练专用):将块缩放乘法运算直接内置于 MXU(矩阵运算单元),消除 VPU 计算开销,单 pod 计算性能是上一代的近 3 倍。芯片间互联带宽是 Ironwood 的两倍,最多可连接 96,000 颗 TPU,形成 3D 环形拓扑,整个 Superpod 提供 121 exaflops FP4 算力。单 Superpod 共享带宽内存达2 petabytes。Google 将其类比为 " 可存放美国国会图书馆全部数字馆藏 100 次 " 的容量。

TPU 8i(推理及强化学习专用):集成专用集合加速引擎,额外降低 5 倍延迟;全部内存缓存直接驻留在硅基上,从根本上打破了制约长上下文解码的 " 内存墙 "。采用全新 Boardfly 拓扑,单 pod 部署 1,152 颗 TPU,可同时运行数百万个并发 Agent,接近零延迟,算力达 11.6 FP8 exaflops,较 256 芯片 Ironwood pod 提升9.8 倍。

Virgo 网络与 NVIDIA Vera Rubin

在网络层,Virgo Network 将 134,000 颗芯片以 47 petabits/s 的无阻塞带宽互联,提供 170 万 exaflops 的总算力,支持在单一集群中组织超过百万颗 TPU,可将数月的训练时间压缩到数周。

与此同时,Google 宣布将成为全球首批提供 NVIDIA Vera Rubin NVL72 的云厂商,并在其上开放 Virgo 网络支持,最多可连接 96 万颗 GPU。

在处理器侧,基于 Arm 架构的自研 Google Axion N4A 实例上线,与同类 x86 实例相比,价格性能比提升最高 2 倍,能耗性能比提升 80%。

金融巨头 Citadel Securities 现场分享了实测数据:在 TPU 上运行工作负载的速度是此前的 2 至 4 倍,成本降低 30%;原本需要数周甚至数天的研究任务,现在可以在数小时乃至数分钟内完成。

Agentic Data Cloud:让 Agent 读懂企业数据

" 没有上下文的推理只是猜测。" 负责数据业务的 Karthik Narain 给出了这场演讲里最直白的一句话。

Agentic Data Cloud 由四项核心创新构成:

Knowledge Catalog(知识目录),定位为企业的 " 通用上下文引擎 "。它深度整合 BigQuery,将表结构和元数据映射为统一的业务语义,并通过 Smart Storage 将非结构化数据(PDF、图片等)一落入 Google

最新头条

实时推荐