蜜桃c,对谈理想CTO谢炎:AI时代需要新的计算架构,【我想】在汽车[上试]出来-兴和县振泓遥百货店

对谈理想CTO谢炎:AI时代需要新的计算架构,【我想】在汽车[上试]出来

2026-05-19 00:20:58 蔚然语风 紫菱衣 / 纯洁的黑狼

The following article is from 晚点Auto Author 晚点团队

上行期理所当然的技术决策,到了用商业结果证明合理性的时候。

文丨赵宇

编辑丨龚方毅

"现在马赫 M100 的业务目标达成度只有 60%。" 北京车展前夕,距离理想自研芯片量产装车只剩一个月,理想汽车 CTO、系统与计算群组负责人谢炎告诉《晚点 Auto》,"真正的成功,是搭载马赫 M100 的 L9 智驾能力跑到业界第一,然后车又卖得很好。那样我们才能非常有底气地说达到业务目标。"

1982 年,美国计算机科学家 Alan Kay 曾说,"你如果真正认真对待你的软件,就要自己做硬件。" 基于类似逻辑,理想在 2022 年立项自研芯片,并已为此累计投入数十亿元资金。谢炎是理想芯片自研项目的负责人。他 2022 年 7 月经美团创始人王兴介绍加入理想。半年后,他晋升为理想 CTO。

提起这个,谢炎在华为和阿里的前同事说他赶上了好时光——当时理想正值业务上行期,公司上下充满 "想赢" 的干劲。特斯拉证明了自研芯片对提升智驾体验的帮助,而国内新能源车市场正意气风发,资本市场也愿意给冒尖的新势力更多想象空间。

到马赫 M100 准备上车时,理想经历了自 ONE 交付以来的首次年度销量下滑,不仅纯电战略遭遇挫折,增程产品也面临空前竞争。随着新势力们挨个步入成立的第十个年头,中国新能源车的产品同质化和价格内卷相互促成。像自研芯片这等烧钱决策,如果当时看起来有多么理所当然,今天就要花多大的力气来证明它的正确。

通常情况下,没有经验的公司会从小芯片做起,低成本跑通设计、流片和供应链流程。即使是小芯片,失败一次也要损失数百万美元;换成先进制程大芯片,除了每个环节更难,流片成本也指数级增加到千万级美元,失败一次跟马斯克又炸掉一枚火箭差不多了。

谢炎刚加入时,理想芯片团队只有两名员工,不到一个月就剩一个了。留守的那位问他,"公司已经决定做芯片,但要怎么做?" 谢炎反对做小芯片试水。他告诉我们,理想不是为了证明有能力做芯片而做芯片,应该直接解决最核心的问题:确保首颗自研芯片量产时能超越同期最强的英伟达芯片。

他没有沿着更主流的 GPGPU 路线追赶英伟达,而是选择了数据流架构。按照理想的说法,马赫 M100 单颗有效算力达 1280 TOPS,同时由于数据流架构提供的算法优化空间,其有效算力是英伟达 Thor-U 的 3 倍。

数据流架构由 MIT 的几位教授在 1970 年代提出。谢炎在美国特拉华大学读研时接触到它,认为它比冯·诺依曼架构更接近大规模 AI 计算的需要,过去几十年一直没有大规模商用一是因为它的优势需要足够大的计算规模才能显现,二是编程和调试难度也更高。

谢炎相信 AI 改变了一些假设,"我相信 AI 时代会有一套新的计算架构,一直想在汽车上把它试出来"。他告诉我们,GPU 依赖集中式调度和大量数据搬运,规模越大,效率损耗越明显;数据流架构让数据驱动计算,理论上能减少等待和搬运,把更多晶体管用于真正的计算。但这也把压力转移到软件栈、编译器和软硬协同上。

杜克大学电子与计算机工程系教授陈怡然认为,马赫 M100 是一次有前景的工程尝试,但不应简单地认为数据流架构就是未来发展方向——关键在于采用哪种具体的数据流设计,以及它与目标应用和软件系统的协同效果。由于大部分优化工作转移到软件栈,实际效果很大程度上取决于编译器的成熟度,以及软硬件协同设计的质量。此外,自动驾驶算法模型演进很快,这种架构必须在 CNN、Transformer 等计算范式间保持足够的灵活性。

"数据流架构是一个宽泛概念,涵盖从脉动阵列、内核级数据重用方案到更激进的编译器调度架构(如 Groq)等多种设计。" 陈怡然教授对《晚点 Auto》解释,"马赫 M100 采用了介于传统 GPU/TPU 与 Groq 纯静态编译器调度模型之间的技术路线,通过编译器等软件更精确地控制芯片内部的数据流动和计算过程,既保持实用的 NPU/SoC 设计,又让数据搬运、本地缓存、互连通信和同步变得更可控。"

他认为,自动驾驶涉及环境感知、行为预测、路径规划等存在大量复杂计算任务的环节,现在还涉及大型 AI 模型推理。"如果软件系统能有效协调这些数据传输和计算,芯片利用率会显著提高,处理速度更稳定、能耗更低。"

谢炎承认马赫 M100 上车过程也确实有不少 "坑":硬件设计复杂度降低,软件复杂度提高,对传统编程方式并不友好,第一版智驾模型从更新到完成车端适配用了两个月。尽管现在已经可以大幅缩短到不到一周,但仍有很大优化空间。接下来,他们还需要通过编译器等软件工具来充分释放芯片的硬件性能潜力。

这件事由一个不大的团队推进。理想芯片团队早期长时间只有几十人,现在约 200 人,仍远小于外界想象中的完整芯片团队规模。谢炎说,人多不一定好,人多时很多都是在搞政治斗争。核心部分自己做,后端、SoC 集成等环节可以借助供应商。在理想近万人的研发体系里,这个团队更像一个安静的角落,尽量不被每月销量起伏干扰。

"只要我们还没困难到一点儿钱都没有,那就保持这个研发强度,把内功练好。重要的是,你相信这件事本身不管在什么时代都重要。" 谢炎说。

以下是我们与谢炎的对话,略经编辑。

不认为马赫 M100 已经成功,现在只达成目标的 60%

晚点:回片时间目前有两种说法,一种是 2025 年初,一种是 2025 年 5 月。

谢炎:2025 年初。我们回片后测试了三个月,到 5 月份,保证它没什么问题,所有东西都稳定了才说成功。一般刚回片就宣布成功,是为了吸引资本。你不测三个月,根本不能确定里面有没有问题。

晚点:流片结果和你们的预期完全一致吗?

谢炎:对。这就是前期工作做得多的好处。你做得越多,回来之后跟你的预期越一致。

晚点:很多公司会在流片成功后很快对外宣布。

谢炎:对,一般都是这么干的。我们把芯片从台积电背回来,第 12 个小时就点亮了,但我什么都没说,因为我知道那不代表任何意义。

晚点:当时有担心过流片回来,但模型在上面跑不了吗?

谢炎:当然有,所以我们在流片之前做了极其充分的测试。大多数公司不会做到我们那个水平。我们不仅在模拟器上把操作系统跑起来,而且把很多大模型都完整地跑了,保证这个东西最终出来时尽量不出意外情况。很多人觉得我们的测试做得过于充分。

晚点:李想知道马赫 M100 流片成功后是什么反应?

谢炎:我不记得了。直到今天,我也不认为它已经算是成功,真正的成功是全新一代理想 L9 搭载马赫 M100 芯片后,智驾能够跑到业界第一,然后车又卖得很好,我们才能非常有底气地说达到业务目标。现在只算达到 60%,即使今天的确已经跑起来了。

晚点:智驾业界第一的目标,包括超过特斯拉吗?

谢炎:我们的最终目标当然包括特斯拉,对标全球最高水平。

理想汽车马赫 M100 自研芯片。来源:理想汽车

晚点:你工作经验非常丰富,见过不同芯片流片。在理想和其他公司,个人感受有什么不一样?

谢炎:这颗芯片还是挺了不起的。好多公司可能做了很长时间,但只是做一些比较小的芯片。所以你看我们团队,虽然有些人在业界也工作了十几、二十几年,甚至更长时间,但还是挺兴奋。

这么短的时间做这么大制程的芯片,在中国不多见。中国有上千家芯片公司,但是做到这个水平的比较少,我们又是第一次做,而且我们是新团队、新架构,工艺制程又有挑战。当然台积电比较成熟、靠谱,我也非常感激他们。

晚点:你前面提到做芯片也希望 "车卖得好",你们需要对汽车产品的商业成功负责吗?

谢炎:我们没法对商业成功负责,只能让芯片具备足够竞争力,也就是性价比一定很高,算力发挥的效能一定超越能买到的芯片。如果做不到这些,自研就没有意义。

晚点:理想是全系车型都要搭载马赫 M100 吗?

谢炎:我们希望是全系搭载。当你有成本、性能优势,没理由不全系搭载。

晚点:全系搭载对技术决策有什么影响?

谢炎:这很重要,我们一开始的目标就是全系搭载,如果内部都不愿意用,那就说明芯片不够好。反过来讲,全系搭载也帮我们计算出大概需要在成本、性能上做到什么程度。包括我们在立项时也计算过,搭载多少辆后能摊平全部研发成本,每块芯片大概要比外购便宜多少钱。

晚点:是从去年芯片流片成功之后就决定全系搭载吗?还是说会有一些中间的讨论?

谢炎:决策过程不是你想象的那样,更多是一开始大家约定好要做到什么程度,经过验证足够有竞争力才能搭载。所以要一步步验证,流片回来,能跑起来,初步看到的确如我所说,性能、成本也有优势,逐步就用了。大部分人还是会打一个问号,因为不参与这件事,也可以理解。当逐步让他们从看见到相信,决策就落地了。

晚点:哪个指标真正打动了他们?

谢炎:主要还是性能。如果性能好,成本又不错,比市面上能买到的都好,产品线没理由不用。

晚点:从芯片跑起来,到真正上车,中间最大的挑战是什么?

谢炎:第一颗芯片最后要上车,让模型都能跑起来且性能很好,还需要一些软件工作。数据流架构芯片最终靠 AI 能够越来越快,但第一颗芯片还是有很多坑。比如它在硬件上的设计复杂度降低,但软件复杂度提升,它不是那么适合人类编程,但这也不是不可以做。因为我自己做编译器,我还是会跟团队讨论怎么让编程更简单。

我们第一版模型编出来花了两个月,后面会是一个月、半个月、一周,编译器越成熟迭代越快。按照我们以前学习的编译理论,最优性能永远可以逼近但不可达到,所以可以不断优化。现在我们从模型更新到完成车端适配用不到一周了,最终我们希望达到一天之内完成适配。

晚点:不同车型搭载几颗马赫 M100 芯片的决策,你参与了吗?

谢炎:各有各的分工,一般对于分工之外的工作我会了解,但尽量不影响他们决策,因为还有商业和其他考虑。

晚点:一颗芯片从设计到量产,最难的环节是什么?

谢炎:各种困难都有,但最难的是选择做什么、不做什么。这些选择来自清晰的产品定义,需要有好的应用场景才能明确目标。在理想,我们能比较清晰地看到需求,这最宝贵。一旦需求定义清晰,技术路线就会清晰,剩下就是匹配资源,看投入产出是否划算。后面的工作也有难度,但并不是最难的。

技术上,前、后端设计的挑战确实比较大,好在我们团队的人都比较靠谱,经验也比较丰富,像罗老师(理想算力单元部门负责人罗旻)都是干了很多年的人。而且后端团队也很强,比如我们要把这颗芯片控制在一定面积以内,他们干了很多非常细致的活儿,以至于我们后端供应商的人都觉得太挑战,他们同时给好几家公司做芯片,说明我们的要求比美国那些公司高。

自研芯片是加入理想的前提,不做就无法实现产品差异化

晚点:关于自研芯片,你们最初是怎么考虑的?

谢炎:在我 2022 年加入公司前一年,理想就已经开始考虑做芯片,但没确定要做多大算力、做到什么程度、什么时候交付。这些是我来理想后,经过讨论才定下来。

来之前跟李想沟通,我提到一个重要观点:未来竞争是产品软硬件一体的竞争,就像手机一样。手机产业早年有两种公司,一种是苹果、华为,有自

最新头条

实时推荐