啊啊啊好大好棒要去了在线观看,AlexWang长访:MuseSpark只是开【胃菜】,Meta《几个》月[后还]有更大模型-兴和县振泓遥百货店

AlexWang长访:MuseSpark只是开【胃菜】,Meta《几个》月[后还]有更大模型

2026-05-20 18:38:17 裘梦 懒虫mm / 端木诺晴

去年六月,Meta 以 140 亿美元的交易从 Scale AI 挖来了创始人 Alex Wang,让他全面执掌公司的人工智能业务。自那以后,Wang 几乎从公众视野中消失,从旧金山搬到了 Meta 总部所在的南湾,全身心投入工作。上个月,他交出了第一份答卷——名为 Muse Spark 的新模型。现在,他首次接受公开专访,谈及了与 Sam Altman 的个人恩怨、扎克伯格送汤招募人才、Meta 开出的惊人薪酬包、团队内部的架构分工、与中国的复杂关系。以下是本次专访的核心内容。

1. 从 Scale 到 Meta:为什么一个创始人会选择加入科技巨头?

主持人: 你们这个团队是怎么组织的?

Alex Wang: 整个组织叫 Meta 超级智能实验室(Meta Superintelligence Labs),由我负责。下面分几个板块。一个是 TBD,这是做大模型研究的核心实验室,某种意义上有点 " 臭名昭著 ",但那里集中了一批最顶尖的研究者和基础设施工程师,他们技术上全部向我汇报。另一个叫产品与应用研究,简称 PAR,由 Nat Friedman 领导,负责把所有产品构建出来,把这些强大的模型部署到世界上。在 MSL 的总体框架下还有 FAIR,它继续做探索性和前瞻性研究。我对他们的很多科学研究特别兴奋——比如用 AI 模型去理解大脑,以及用 AI 模型去理解计算化学,我们做了一个通用的原子模型叫 UMA。这三个部分构成 MSL,由我统筹,同时我也深度参与 TBD 的日常工作。另外,Daniel Gross 协助领导 Meta Compute,专注于长期基础设施规划,确保我们有足够的 GPU 和数据中心来支撑这项极其大胆的工程。他跟我们紧密合作。

主持人: 这批人里你最早认识谁?

Alex Wang: 我认识 Nat 和 Daniel 很久了。Nat 是我在 Scale 最早的天使投资人之一,在我完成 YC 之前就投了 Scale,多年来一直给我建议。Daniel 也是我创业早期就认识了。我们还有一位首席科学家 Shengjia Zhao,他协助统筹整个 MSL 的科研议程。

主持人: 从 Scale AI 创始人兼 CEO 变成 Meta AI 负责人,这是一个巨大的身份转换。你是怎么做出这个决定的?你和扎克伯格在太浩湖的那次对话是怎样的?

Alex Wang: 我和 Mark 认识很多年了。我还在经营 Scale 的时候,他就很慷慨地给过我很多时间,给了我不少建议。他显然是一位极其有经验的创始人。我们其实在 AI 热潮之前就开始聊 AI 了—— Scale 从 2016 年起就在做 AI,那时候主要还是自动驾驶,后来经历了很多技术转型。大概一年前,我们开始探讨有没有更紧密合作的方式。

当时 Mark 越来越 AGI-pilled,他真的知道 AI 会彻底改变 Meta,同时也意识到 AI 是一种一生中只会出现一次的变革性技术。所以他非常专注,知道自己想押注很大。与此同时,Llama 4 当时并不在公司需要的轨道上,这一点他也公开说过。我们就开始从非常高的层面聊:能不能更紧密地合作?会是什么样子?这是一段非常开放的头脑风暴。最终我们找到了一个对 Scale 有利、对 Meta 也有利的合作方式。我们都有信念,这会是我们双方都会为之骄傲的事业。他大概一年前发出了那篇关于 " 个人超级智能 " 的备忘录,之后我们就保持沉默。但那个愿景——以一种赋能人的方式构建这项技术,让尽可能多的人拥有它,让它尽可能民主化,让每个人都能表达自我、获得更大的自主权、去创造和构建——这既是他的北极星,也是我的。

主持人: Scale 是你身份的一部分。从一个非常显眼的公司的创始人,变成一家有八万名员工的公司的管理者,这个转折非常大。

Alex Wang: 确实非常不同。在整个过程中,我一直在思考几件事。AI 的进步速度比我想象的快得多。在这个过程中,几件事开始让我印象深刻。第一,那些亲自构建 AI 模型的人拥有越来越大的 " 权利 " ——无论是经济权利还是产品权利,能在模型基础上构建更多东西。关于生态系统会如何演变,早年有过很多争论,但由于模型改进的速度和研究的节奏太快了,构建模型的地方正在成为整个生态系统中最令人兴奋的地方。第二,AI 的下一阶段本质上拼的是算力。如果你有海量算力,你就有能力去做大赌注、部署产品、做那些没有算力就根本做不了的事。这会带来一种有趣的科技生态分层:我们不能再把所有科技公司当成同一类。有算力的公司和没有算力的公司,能做的事情完全不同。Meta 有 Mark 的全力投入,有非常大且大胆的战略,我们能用海量算力去推动研究和产品。这让我们有机会真正对世界产生巨大的影响。

2. 小团队 + 高密度 + 大赌注:九个月追上最前沿的秘密

主持人: 你们做了大规模招聘,开出了前所未有的薪酬。十个月过去了,这个新团队怎么样?挑战在哪里?最令人兴奋的是什么?

Alex Wang: 我加入 Meta 的时候,很清楚整个 AI 努力需要一个重置和重建,才能回到正确的轨道上。Llama 4 不在正确的轨道上,我们落后于前沿。我们需要一个能让我们以极快速度追赶甚至超越前沿的计划。问题出在哪里?我觉得最根本的是:很多领先的实验室,整个组织都围绕一个前提建立——超级智能正在到来,而且非常接近。这是一个非常现实的东西,可以创造出来。然后你把实验室和业务的整个规划,以及你关注的东西,都建立在这个根本信念之上。Meta 缺的就是这个,先把超级智能当回事,然后围绕这个核心前提重建所有假设。这其实是相当普遍的——很多大公司里不一定有这种信念。因为大公司的构造跟初创公司不一样。初创公司是从零开始,带着 " 超级智能即将到来 " 这种疯狂想法出发的。但这个问题现在已经解决了,MSL 是围绕着 " 超级智能正在到来 " 这个概念建立的。

我们为整个计划定下了几条原则:认真对待超级智能、让技术声音最响、保持科学严谨、聚焦基础、做大赌注。当我刚开始组建 TBD 和 MSL 的时候,我一直在思考:什么样的实验室形态才能让你拥有极快的速度,去追赶甚至超越前沿?我总结出三个可能的路径。第一,更高的人均算力。很多大实验室算力总量很大,但被分散到太多方向,这反而拖慢了单个研究者的速度。如果你做一个更聚焦的、人更少的团队,每个人拥有更多算力,研究进度反而更快。第二,极高的人才密度。一个小团队里每个人都是顶尖高手,永远比一个责任分散的大组织跑得快。第三,做非常大胆的研究赌注。行业内大家都认同,确实存在一些非常大、风险非常高、但一旦成功就能彻底改变范式的赌注。所以我们除了构建有竞争力的前沿模型之外,也把大量资源和算力分配到这些大胆的赌注上,因为它们一旦成功,就能给我们带来令人难以置信的未来模型。

3. 与 Sam Altman 的个人恩怨

主持人: 从外面看,你们像雇佣兵一样砸重金抢人,跟 Elon 当年搞 Grok 有点像。但你说实验室内部其实更像一家初创公司。还有扎克伯格送汤 * 的事是真的吗?

* 汤:这是硅谷 AI 人才争夺战中的一个著名桥段。当时 Meta 为了从 OpenAI、Anthropic 等公司挖顶尖 AI 研究员,开出了前所未有的百万甚至千万美元级别的薪酬包。在这场激烈的抢人大战中,流传出一个说法:扎克伯格亲自下厨煮汤,送到候选人面前,以此表达对人才的极度重视和诚意。

Alex Wang: 这是一个外部认知和内部日常之间差异很大的地方。外界的一些印象,很多来自于报道。但很多报道本身就有夸大。当然一部分原因也是我们招聘得太快了——我知道如果想造出最好的模型,团队必须在昨天就就位,所以我们只能用最快速度完成招聘。但我认为实验室内部的文化其实非常像一家初创公司。这里有一个完全新组建的团队。人们加入是因为他们看到了高人均算力、真正顶尖的人才密度、以及去做非常大胆的研究赌注的自由和资源。大部分研究者加入的主要原因根本不是钱——他们留在原来位置的经济回报也非常好。真正的动机是:有机会从零开始,拥有大量算力,去追求他们真正想做的非常大胆的研究方向,而且是在一个不臃肿的小团队里。

所以整体氛围和状态非常健康。很多来过我们实验室、曾在其他实验室工作过的人都说,这里的氛围让他们想起了 OpenAI 或 Anthropic 的早期。某种意义上确实如此,因为我们的努力到现在才十个月。

关于汤,我不确定是不是我们亲手做的,但我们确实想向每个人证明,我们真的在乎这项技术,在乎他们具体的研究方向。招聘过程非常个性化。人们需要知道我们是认真的,因为默认情况下,很多人并不知道该怎么看待 Meta 的 AI 努力。所以需要我们一个一个去找他们谈,解释我们在构建什么,为什么我们关心这项技术,我们想用它做什么。

主持人: 你和 Sam Altman 以前是室友。我发短信告诉他你要上我们节目,他没说什么好听的话。这种个人代价有多大?

Alex Wang: 确实有一些不愉快。但我的真实希望是,随着我们越来越接近超级智能,行业里所有这些人与人之间的敌意都会随着时间的推移而消退。人们在某个时刻会走到一起,意识到我们正在构建的是一项极其重要的技术,我们都需要非常审慎地对待它。确保我们开发的技术和部署方式尽可能深思熟虑,这是我觉得自己负有责任的一件事。

主持人: 你前 CTO Jan 离开后说你还太年轻、太缺经验,说更多人会走。这对你作为这家大公司的年轻领导者意味着什么?你跟他后来聊过吗?

Alex Wang: 我几周后在印度见到他了。Jan 是一个众所周知的敢说话的人,大家都清楚 Jan 在想什么。他说了他说的话。我在印度见到他,他祝贺了我们 Muse Spark 的发布。我看到你们在 X 上修复关系了。真的,就像我刚才说的,我相信随着我们越来越接近超级智能,所有个人恩怨都会消散。

主持人: 看起来现在好像越来越糟了?

Alex Wang: 也许先变糟再变好。但我对我们建立 MSL 的方式、我们的研究努力和我们正在取得的进展非常有信念。我很兴奋能向世界展示我们的研究者正在做的了不起的工作。关于年龄——人们在我整个硅谷生涯中一直在说这些,我已经几乎不去想了。关于 " 你不是工程师 " 的说法,这绝对不属实,我曾经是硅谷的一名软件工程师。但 AI 行业里,总是有各种各样的错误描述。人们总是说三道四,外界的东西从来不完全是正确的。这可能会让人沮丧,但我选择把精力全部投入到我们的工作和产出上。我对 Muse Spark 非常自豪,对我们在做的模型和产品更兴奋。从长远来看,一切都会证明自己。我的管理哲学是—— Steve Jobs 有句名言:大多数公司雇人然后告诉他们做什么,但我们雇人是为了让他们告诉我们该做什么。这是 TBD 和 MSL 的核心理念。我们要创造最好的环境,让最杰出的研究者做出他们职业生涯中最出色的工作。

4.Muse Spark 只是开胃菜:可预测的规模化、极致的 token 效率与多代理缩放

主持人: Muse Spark 到底在你们整个路线图中处于什么位置?我们看到它在部分基准上表现不错,但在另一些基准上落后。你们强调了一些效率优势和那个 16 个代理同时工作的能力。感觉你们像是在某些技术方向上走在了前面,但并没有宣布全面胜利。

Alex Wang: 远不是全面胜利。过去九个月,我们把整个研究栈几乎全部重建了——预训练栈、RL 栈、大量的科学工作、数据工作。某种意义上,这九个月是一次彻底的大修。Mu

最新头条

实时推荐