拖?????摸??91,Google瞧不上Harness：发更强TPU搞Agent全家桶，(还随)手替苹果发布【了新】Siri-兴和县振泓遥百货店

" 试验阶段结束了。" Google Cloud CEO Thomas Kurian 在开场不到三分钟就抛出这句话。

Google Cloud Next 大会于当地时间 4 月 22 日上午在拉斯维加斯召开。这是近年来科技圈最受关注的云计算大会之一，今年的主角只有一个：Agent。

从 Keynote 的章节命名就能看出 Google 的野心：Agentic Enterprise Blueprint、Agentic Data Cloud、Agentic Defense、Agentic Taskforce...... 每一个模块都冠上了 "Agentic" 的前缀，Google Cloud 向世界介绍的是一套从算力底座到应用前端的完整 agent 架构。

但如果你把这场 Keynote 从头看到尾，会发现一件非常有意思的事：

Google 是真的瞧不上 Harness，在整场大会里对这个火热名词一字未提。

在热火朝天的 agent 浪潮里，Harness 是最近一段时间最火热的概念。它被用来描述建设 agent 的过程里所需要的一切基础设施。

而在疯狂的讨论里，如我们之前所观察的，Google 的沉默振聋发聩。它完全缺席了。

这次 Google Cloud 的大会上，缺席的原因终于明白：

Google 根本不认同什么 Harness，或者说它拒绝被其他人提出的模棱两可概念牵着鼻子走，它提出的是从 AI Hypercomputer（包括新发布的训练和推理分家的更强 TPU），Agentic Data Cloud、Agentic Defense、Agentic Task Force，到最重要的 Gemini Enterprise Agent Platform 的 Agent 五层架构体系。

它要用这个全家桶抢走所有企业 agent 的生意。在这次大会上，甚至出现了活久见的一幕：苹果的 logo 出现在 Google 的发布会大屏幕上，恍惚以为误入乔布斯剧院。Google 就这样以客户案例展示的形式 " 发布 " 了新的 Siri 的关键信息。

这一切都是 Google 在秀肌肉。

以下是这场长达两小时 Keynote 的核心内容解析。

Sundar Pichai ：资本投入创历史

Google CEO Sundar Pichai 公布了一个让人瞠目的数字：Google 在 2022 年的资本支出为 310 亿美元，而 2026 年的预算区间是1750 亿至 1850 亿美元，四年内实现了近 6 倍的增长。其中超过一半的机器学习算力将专门分配给云业务。

他随即用 Google 自己的案例说明 Agent 的实际价值：

Google 内部目前75% 的新代码由 AI 生成，并由工程师审核通过（去年秋天这一比例还是 50%）。在一次复杂的代码迁移任务中，工程师组建了由 " 规划者、协调者、编码者 " 三类角色构成的 Agent 系统，最终将迁移速度提升了 6 倍。

在营销层面，团队借助 Gemini 生成大量创意素材变体，实现精细化个性投放，带来 70% 的制作周期缩短和 20% 的转化率提升。

在安全层面，Google 安全运营中心的 Agent 每月自动处理数以万计的非结构化威胁报告，将威胁缓解时间压缩了超过 90%。

Pichai 随后宣布了大会最重磅的产品：Gemini Enterprise Agent Platform，并将其定义为 "Agent 时代的任务控制中枢 "。

Gemini Enterprise Agent Platform：企业 Agent 的操作系统

这是整场 Keynote 着墨最多的部分，也是 Google 今年最核心的产品策略落点。

新模型阵容

Google 发布了一批新模型，均处于 Preview 阶段：

Gemini 3.1 Pro，最新的旗舰推理模型，专为复杂工作流编排设计，可与企业 API 和系统直接交互，减少调优需求。Databricks、JetBrains、Replit 均已选择接入。

Gemini 3.1 Flash Image（内部代号 Nano Banana 2），面向高保真视觉资产生成。Veo 3.1 Lite，Google 最具成本效益的视频模型，定位高并发视频应用场景。Lyria 3 Pro，企业级音频和音乐生成模型。

值得关注的是，Google 同时支持 Anthropic 全线模型，并在大会上宣布新增对 Claude Opus 4.7 的支持。

此外，Google 还宣布成为苹果的首选云合作伙伴，双方正在基于 Gemini 技术共同开发下一代 Apple Foundation Models，这些模型将驱动包括 " 更个性化的 Siri" 在内的苹果未来 AI 功能。

Agent 的完整生命周期管理

平台的核心价值在于覆盖 Agent 从构建到治理的全生命周期：

Low-Code Agent Studio 允许非技术员工用自然语言创建和部署 Agent，将业务规则融入 LLM 推理，实现可预期的自主执行。

Agent Registry 是 Agent 的 " 总台账 "，为组织内每一个内部 Agent 和工具建立索引，确保可发现性与治理合规。Skills & Tools Registry 则提供可复用的模块化指令包，让 Agent 能快速习得特定领域的专项能力。

Agent Marketplace 支持从生态合作伙伴直接搜索和部署专业 Agent，接入方包括 Atlassian、Box、Oracle、ServiceNow、Workday 等主流企业软件厂商。

平台原生支持 Model Context Protocol（MCP），并将全部 GCP 服务暴露为 MCP 接口，使任意 Agent 均可无缝调用任意 GCP 服务。

安全与治理：Agent 身份识别

在安全侧，平台引入了 Agent Identity 机制——每个 Agent 被分配唯一的加密 ID 和明确的授权策略，所有行为均可追踪和审计。Agent Gateway 充当统一管控台，跨组织执行策略，配合 Model Armor 防止敏感数据泄露。

Agent Observability 提供粒度化的执行路径可视化，支持 OTel 标准遥测，开发者可追踪 trace、监控工具调用，诊断推理死循环。

真实客户案例

客户采用数据颇为亮眼：

德国保险公司 Signal Iduna 上线数周后即达到 80% 的使用率，11,000 名员工开始自主构建专属 Agent，其健康险 Agent 将用户答复速度提升了 37%，周活用户增长 400%。KPMG 首月达到 90% 的采用率，上线超过 100 个 Agent。Walmart 向门店管理人员推出 Gemini Enterprise，让管理者能花更多时间在卖场与员工、顾客互动，而非坐在办公室盯屏幕。NASA 使用 Gemini Enterprise Agent 为 Artemis II 载人航天任务提供飞行就绪性支持，确保宇航员安全。

此外，Citi Wealth 与 Google Cloud 及 DeepMind 合作，推出了名为 "Citi Sky" 的 AI 财富团队成员，可全天候多语言为客户提供金融服务。Virgin Voyages 部署了面向船员的 AI 助理 "Project Ruby"，将生产时间线缩短约 60%，并拉动单月销售额增长 28%，实现了一个销售纪录季度。

大会还邀请了单板滑雪传奇、三届奥运金牌得主 Shaun White 上台，现场演示 Google Cloud 如何用 AI 分析他在 2017 年的比赛影像——将一个不到三秒的腾空动作逐帧拆解，追踪三维姿态、旋转速度、腾空时长，为新生代运动员的技术训练提供数据支持。

AI Hypercomputer：算力基础设施的两条腿

负责基础设施的高级副总裁 Amin Vadhat 说：" 在 Agent 时代，算力不再由一块芯片定义，算力就是整个数据中心。"

第八代 TPU：训练与推理分家

Google 本次发布了 TPU 第八代，并首次拆分为两个独立平台：

TPU 8t（训练专用）：将块缩放乘法运算直接内置于 MXU（矩阵运算单元），消除 VPU 计算开销，单 pod 计算性能是上一代的近 3 倍。芯片间互联带宽是 Ironwood 的两倍，最多可连接 96,000 颗 TPU，形成 3D 环形拓扑，整个 Superpod 提供 121 exaflops FP4 算力。单 Superpod 共享带宽内存达2 petabytes。Google 将其类比为 " 可存放美国国会图书馆全部数字馆藏 100 次 " 的容量。

TPU 8i（推理及强化学习专用）：集成专用集合加速引擎，额外降低 5 倍延迟；全部内存缓存直接驻留在硅基上，从根本上打破了制约长上下文解码的 " 内存墙 "。采用全新 Boardfly 拓扑，单 pod 部署 1,152 颗 TPU，可同时运行数百万个并发 Agent，接近零延迟，算力达 11.6 FP8 exaflops，较 256 芯片 Ironwood pod 提升9.8 倍。

Virgo 网络与 NVIDIA Vera Rubin

在网络层，Virgo Network 将 134,000 颗芯片以 47 petabits/s 的无阻塞带宽互联，提供 170 万 exaflops 的总算力，支持在单一集群中组织超过百万颗 TPU，可将数月的训练时间压缩到数周。

与此同时，Google 宣布将成为全球首批提供 NVIDIA Vera Rubin NVL72 的云厂商，并在其上开放 Virgo 网络支持，最多可连接 96 万颗 GPU。

在处理器侧，基于 Arm 架构的自研 Google Axion N4A 实例上线，与同类 x86 实例相比，价格性能比提升最高 2 倍，能耗性能比提升 80%。

金融巨头 Citadel Securities 现场分享了实测数据：在 TPU 上运行工作负载的速度是此前的 2 至 4 倍，成本降低 30%；原本需要数周甚至数天的研究任务，现在可以在数小时乃至数分钟内完成。

Agentic Data Cloud：让 Agent 读懂企业数据

" 没有上下文的推理只是猜测。" 负责数据业务的 Karthik Narain 给出了这场演讲里最直白的一句话。

Agentic Data Cloud 由四项核心创新构成：

Knowledge Catalog（知识目录），定位为企业的 " 通用上下文引擎 "。它深度整合 BigQuery，将表结构和元数据映射为统一的业务语义，并通过 Smart Storage 将非结构化数据（PDF、图片等）一落入 Google

Google瞧不上Harness：发更强TPU搞Agent全家桶，(还随)手替苹果发布【了新】Siri

猜你喜欢

最新头条