啊啊啊好大好棒要去了在线观看,AlexWang长访：MuseSpark只是开【胃菜】，Meta《几个》月[后还]有更大模型-兴和县振泓遥百货店

去年六月，Meta 以 140 亿美元的交易从 Scale AI 挖来了创始人 Alex Wang，让他全面执掌公司的人工智能业务。自那以后，Wang 几乎从公众视野中消失，从旧金山搬到了 Meta 总部所在的南湾，全身心投入工作。上个月，他交出了第一份答卷——名为 Muse Spark 的新模型。现在，他首次接受公开专访，谈及了与 Sam Altman 的个人恩怨、扎克伯格送汤招募人才、Meta 开出的惊人薪酬包、团队内部的架构分工、与中国的复杂关系。以下是本次专访的核心内容。

1. 从 Scale 到 Meta：为什么一个创始人会选择加入科技巨头？

主持人：你们这个团队是怎么组织的？

Alex Wang：整个组织叫 Meta 超级智能实验室（Meta Superintelligence Labs），由我负责。下面分几个板块。一个是 TBD，这是做大模型研究的核心实验室，某种意义上有点 " 臭名昭著 "，但那里集中了一批最顶尖的研究者和基础设施工程师，他们技术上全部向我汇报。另一个叫产品与应用研究，简称 PAR，由 Nat Friedman 领导，负责把所有产品构建出来，把这些强大的模型部署到世界上。在 MSL 的总体框架下还有 FAIR，它继续做探索性和前瞻性研究。我对他们的很多科学研究特别兴奋——比如用 AI 模型去理解大脑，以及用 AI 模型去理解计算化学，我们做了一个通用的原子模型叫 UMA。这三个部分构成 MSL，由我统筹，同时我也深度参与 TBD 的日常工作。另外，Daniel Gross 协助领导 Meta Compute，专注于长期基础设施规划，确保我们有足够的 GPU 和数据中心来支撑这项极其大胆的工程。他跟我们紧密合作。

主持人：这批人里你最早认识谁？

Alex Wang：我认识 Nat 和 Daniel 很久了。Nat 是我在 Scale 最早的天使投资人之一，在我完成 YC 之前就投了 Scale，多年来一直给我建议。Daniel 也是我创业早期就认识了。我们还有一位首席科学家 Shengjia Zhao，他协助统筹整个 MSL 的科研议程。

主持人：从 Scale AI 创始人兼 CEO 变成 Meta AI 负责人，这是一个巨大的身份转换。你是怎么做出这个决定的？你和扎克伯格在太浩湖的那次对话是怎样的？

Alex Wang：我和 Mark 认识很多年了。我还在经营 Scale 的时候，他就很慷慨地给过我很多时间，给了我不少建议。他显然是一位极其有经验的创始人。我们其实在 AI 热潮之前就开始聊 AI 了—— Scale 从 2016 年起就在做 AI，那时候主要还是自动驾驶，后来经历了很多技术转型。大概一年前，我们开始探讨有没有更紧密合作的方式。

当时 Mark 越来越 AGI-pilled，他真的知道 AI 会彻底改变 Meta，同时也意识到 AI 是一种一生中只会出现一次的变革性技术。所以他非常专注，知道自己想押注很大。与此同时，Llama 4 当时并不在公司需要的轨道上，这一点他也公开说过。我们就开始从非常高的层面聊：能不能更紧密地合作？会是什么样子？这是一段非常开放的头脑风暴。最终我们找到了一个对 Scale 有利、对 Meta 也有利的合作方式。我们都有信念，这会是我们双方都会为之骄傲的事业。他大概一年前发出了那篇关于 " 个人超级智能 " 的备忘录，之后我们就保持沉默。但那个愿景——以一种赋能人的方式构建这项技术，让尽可能多的人拥有它，让它尽可能民主化，让每个人都能表达自我、获得更大的自主权、去创造和构建——这既是他的北极星，也是我的。

主持人： Scale 是你身份的一部分。从一个非常显眼的公司的创始人，变成一家有八万名员工的公司的管理者，这个转折非常大。

Alex Wang：确实非常不同。在整个过程中，我一直在思考几件事。AI 的进步速度比我想象的快得多。在这个过程中，几件事开始让我印象深刻。第一，那些亲自构建 AI 模型的人拥有越来越大的 " 权利 " ——无论是经济权利还是产品权利，能在模型基础上构建更多东西。关于生态系统会如何演变，早年有过很多争论，但由于模型改进的速度和研究的节奏太快了，构建模型的地方正在成为整个生态系统中最令人兴奋的地方。第二，AI 的下一阶段本质上拼的是算力。如果你有海量算力，你就有能力去做大赌注、部署产品、做那些没有算力就根本做不了的事。这会带来一种有趣的科技生态分层：我们不能再把所有科技公司当成同一类。有算力的公司和没有算力的公司，能做的事情完全不同。Meta 有 Mark 的全力投入，有非常大且大胆的战略，我们能用海量算力去推动研究和产品。这让我们有机会真正对世界产生巨大的影响。

2. 小团队 + 高密度 + 大赌注：九个月追上最前沿的秘密

主持人：你们做了大规模招聘，开出了前所未有的薪酬。十个月过去了，这个新团队怎么样？挑战在哪里？最令人兴奋的是什么？

Alex Wang：我加入 Meta 的时候，很清楚整个 AI 努力需要一个重置和重建，才能回到正确的轨道上。Llama 4 不在正确的轨道上，我们落后于前沿。我们需要一个能让我们以极快速度追赶甚至超越前沿的计划。问题出在哪里？我觉得最根本的是：很多领先的实验室，整个组织都围绕一个前提建立——超级智能正在到来，而且非常接近。这是一个非常现实的东西，可以创造出来。然后你把实验室和业务的整个规划，以及你关注的东西，都建立在这个根本信念之上。Meta 缺的就是这个，先把超级智能当回事，然后围绕这个核心前提重建所有假设。这其实是相当普遍的——很多大公司里不一定有这种信念。因为大公司的构造跟初创公司不一样。初创公司是从零开始，带着 " 超级智能即将到来 " 这种疯狂想法出发的。但这个问题现在已经解决了，MSL 是围绕着 " 超级智能正在到来 " 这个概念建立的。

我们为整个计划定下了几条原则：认真对待超级智能、让技术声音最响、保持科学严谨、聚焦基础、做大赌注。当我刚开始组建 TBD 和 MSL 的时候，我一直在思考：什么样的实验室形态才能让你拥有极快的速度，去追赶甚至超越前沿？我总结出三个可能的路径。第一，更高的人均算力。很多大实验室算力总量很大，但被分散到太多方向，这反而拖慢了单个研究者的速度。如果你做一个更聚焦的、人更少的团队，每个人拥有更多算力，研究进度反而更快。第二，极高的人才密度。一个小团队里每个人都是顶尖高手，永远比一个责任分散的大组织跑得快。第三，做非常大胆的研究赌注。行业内大家都认同，确实存在一些非常大、风险非常高、但一旦成功就能彻底改变范式的赌注。所以我们除了构建有竞争力的前沿模型之外，也把大量资源和算力分配到这些大胆的赌注上，因为它们一旦成功，就能给我们带来令人难以置信的未来模型。

3. 与 Sam Altman 的个人恩怨

主持人：从外面看，你们像雇佣兵一样砸重金抢人，跟 Elon 当年搞 Grok 有点像。但你说实验室内部其实更像一家初创公司。还有扎克伯格送汤 * 的事是真的吗？

* 汤：这是硅谷 AI 人才争夺战中的一个著名桥段。当时 Meta 为了从 OpenAI、Anthropic 等公司挖顶尖 AI 研究员，开出了前所未有的百万甚至千万美元级别的薪酬包。在这场激烈的抢人大战中，流传出一个说法：扎克伯格亲自下厨煮汤，送到候选人面前，以此表达对人才的极度重视和诚意。

Alex Wang：这是一个外部认知和内部日常之间差异很大的地方。外界的一些印象，很多来自于报道。但很多报道本身就有夸大。当然一部分原因也是我们招聘得太快了——我知道如果想造出最好的模型，团队必须在昨天就就位，所以我们只能用最快速度完成招聘。但我认为实验室内部的文化其实非常像一家初创公司。这里有一个完全新组建的团队。人们加入是因为他们看到了高人均算力、真正顶尖的人才密度、以及去做非常大胆的研究赌注的自由和资源。大部分研究者加入的主要原因根本不是钱——他们留在原来位置的经济回报也非常好。真正的动机是：有机会从零开始，拥有大量算力，去追求他们真正想做的非常大胆的研究方向，而且是在一个不臃肿的小团队里。

所以整体氛围和状态非常健康。很多来过我们实验室、曾在其他实验室工作过的人都说，这里的氛围让他们想起了 OpenAI 或 Anthropic 的早期。某种意义上确实如此，因为我们的努力到现在才十个月。

关于汤，我不确定是不是我们亲手做的，但我们确实想向每个人证明，我们真的在乎这项技术，在乎他们具体的研究方向。招聘过程非常个性化。人们需要知道我们是认真的，因为默认情况下，很多人并不知道该怎么看待 Meta 的 AI 努力。所以需要我们一个一个去找他们谈，解释我们在构建什么，为什么我们关心这项技术，我们想用它做什么。

主持人：你和 Sam Altman 以前是室友。我发短信告诉他你要上我们节目，他没说什么好听的话。这种个人代价有多大？

Alex Wang：确实有一些不愉快。但我的真实希望是，随着我们越来越接近超级智能，行业里所有这些人与人之间的敌意都会随着时间的推移而消退。人们在某个时刻会走到一起，意识到我们正在构建的是一项极其重要的技术，我们都需要非常审慎地对待它。确保我们开发的技术和部署方式尽可能深思熟虑，这是我觉得自己负有责任的一件事。

主持人：你前 CTO Jan 离开后说你还太年轻、太缺经验，说更多人会走。这对你作为这家大公司的年轻领导者意味着什么？你跟他后来聊过吗？

Alex Wang：我几周后在印度见到他了。Jan 是一个众所周知的敢说话的人，大家都清楚 Jan 在想什么。他说了他说的话。我在印度见到他，他祝贺了我们 Muse Spark 的发布。我看到你们在 X 上修复关系了。真的，就像我刚才说的，我相信随着我们越来越接近超级智能，所有个人恩怨都会消散。

主持人：看起来现在好像越来越糟了？

Alex Wang：也许先变糟再变好。但我对我们建立 MSL 的方式、我们的研究努力和我们正在取得的进展非常有信念。我很兴奋能向世界展示我们的研究者正在做的了不起的工作。关于年龄——人们在我整个硅谷生涯中一直在说这些，我已经几乎不去想了。关于 " 你不是工程师 " 的说法，这绝对不属实，我曾经是硅谷的一名软件工程师。但 AI 行业里，总是有各种各样的错误描述。人们总是说三道四，外界的东西从来不完全是正确的。这可能会让人沮丧，但我选择把精力全部投入到我们的工作和产出上。我对 Muse Spark 非常自豪，对我们在做的模型和产品更兴奋。从长远来看，一切都会证明自己。我的管理哲学是—— Steve Jobs 有句名言：大多数公司雇人然后告诉他们做什么，但我们雇人是为了让他们告诉我们该做什么。这是 TBD 和 MSL 的核心理念。我们要创造最好的环境，让最杰出的研究者做出他们职业生涯中最出色的工作。

4.Muse Spark 只是开胃菜：可预测的规模化、极致的 token 效率与多代理缩放

主持人： Muse Spark 到底在你们整个路线图中处于什么位置？我们看到它在部分基准上表现不错，但在另一些基准上落后。你们强调了一些效率优势和那个 16 个代理同时工作的能力。感觉你们像是在某些技术方向上走在了前面，但并没有宣布全面胜利。

Alex Wang：远不是全面胜利。过去九个月，我们把整个研究栈几乎全部重建了——预训练栈、RL 栈、大量的科学工作、数据工作。某种意义上，这九个月是一次彻底的大修。Mu

AlexWang长访：MuseSpark只是开【胃菜】，Meta《几个》月[后还]有更大模型

猜你喜欢

最新头条