设计芯片的 AI:Recursive 的 Anna Goldie 和 Azalia Mirhoseini

cover>

摘要

Anna Goldie 和 Azalia Mirhoseini 是 AlphaChip 的联合创造者,这项在 Google DeepMind 完成的工作首次展示了深度强化学习(Deep Reinforcement Learning, DRL)智能体能够生成超越人类的芯片布局(Chip Layout),并已实际用于 Google 过去四代 TPU(张量处理单元,Tensor Processing Unit)AI 加速器芯片、数据中心 CPU Axion、Pixel 手机芯片以及自动驾驶芯片的流片(Tape-out)。在 Sequoia AI Ascent 2026 上,她们介绍了新公司 Recursive Intelligence。公司的核心命题是一个精妙的递归闭环:芯片是 AI 的燃料,而我们应该用 AI 来设计、优化和自动化芯片设计过程。 Recursive 的三阶段愿景清晰而宏大:第一阶段加速现有芯片设计流程——解决物理设计(Physical Design)和设计验证(Design Verification)两个各耗时长达一年、需要成百上千名人类专家的瓶颈;第二阶段民主化芯片设计——成为一个平台,输入工作负载(如下一代前沿模型),输出可直接送去制造(Fabrication)的 GDS2 格式芯片设计;第三阶段垂直整合——自研芯片、自训模型、协同进化。她们的核心技术路径是:首先将传统 EDA 工具的速度提升 100,000 倍,使其适合 AI 的快速迭代循环,然后用 AI 在巨大的优化空间中执行协同优化(Co-optimization)。她们展示了自研静态时序分析(Static Timing Analysis, STA)引擎与商业工具高保真度相关,且速度快 1000 倍——当它与 AI 外层优化循环结合时,性能进一步提升。她们将 Recursive 定位为芯片设计领域的"台积电时刻"——正如台积电(TSMC)通过代工制造(Fabless)模式让英伟达、苹果等公司专注于芯片设计一样,Recursive 希望成为"无设计(Designless)"模式的设计平台,使更多公司专注于应用层和模型层,而将芯片设计的复杂性交给 Recursive,从而引发芯片的寒武纪大爆发(Cambrian Explosion)。

正文

AlphaChip 的遗产:从《自然》到量产芯片

Anna 和 Azalia 的合作跨越了十年,横跨 Google Brain、Anthropic 和 DeepMind,同时 Anna 还在全职工作的同时完成了博士学位,而 Azalia 则加入了斯坦福大学教职——"我们在许多不同地方一起工作了很长时间。"

2018 年,她们开始了 AlphaChip 的工作,开发了一个深度强化学习智能体,能够生成超越人类的芯片布局(Chip Layout)。这项工作发表在《自然》(Nature)杂志上,但在她们看来,真正重要的部分是它被实际用于真实芯片的流片(Tape-out)——不仅仅是学术论文或概念验证。

AlphaChip 已被用于:

有了这些验证,她们决定创立 Recursive Intelligence,将这项工作提升到新的层次——承担整个芯片设计工作流程(Chip Design Workflow)。

三阶段愿景

Recursive 的路线图分为三个阶段:

第一阶段:加速芯片设计

当前芯片设计有两个"长杆"瓶颈:

  1. 物理设计(Physical Design): 将数十亿个标准单元(Standard Cells)或晶体管放置(Place)到芯片画布上,并对数十亿个组件进行布线(Route)。可能需要长达一年。
  2. 设计验证(Design Verification): 验证芯片逻辑的正确性。同样可能耗时一年。

每个环节涉及数百或数千名人类专家,风险极高——据估算,Nvidia Blackwell 芯片每延迟一天,机会成本损失约为 2.25 亿美元。 Recursive 的目标是帮助现有芯片制造商更快进入市场,构建更快、更便宜、更环保的芯片。

第二阶段:民主化芯片设计

成为一个设计新硬件的平台。输入是一个工作负载(Workload)——例如下一代的 Quad 模型——然后平台设计出一个能大规模加速该工作负载的架构,并完成从架构到 GDS2 洁净格式(可直接送往晶圆厂制造)的整个设计过程。这意味着,任何以足够规模运行工作负载的公司都可以从定制芯片中受益——即使它们没有数百或数千名人类专家团队。

第三阶段:垂直整合

如果拥有快速设计高性能芯片的能力,为什么不制造自己的芯片?为什么不训练自己的模型,并与芯片协同进化(Co-evolve)?以无法匹敌的价格或性能提供智能服务。

技术路径:快 100,000 倍的工具 + AI 协同优化

Azalia 用一张流程图展示了传统芯片设计流程:从架构设计(Architecture Design)一直到签核(Sign-off),包含多个环节。在传统模式下,每个环节由人类专家使用商业工具完成,单个优化迭代可能需要数天才能运行完。

Recursive 的方法是:首先重新设计这些工具的运行方式,使其快 100,000 倍——然后它们才适合与 AI 配合使用。因为 AI 需要快速的迭代循环,只有在极快的反馈信号下,AI 才能在非常庞大的优化空间中指数级地学习和协同优化。

她们展示了一个具体例子:静态时序分析(STA)引擎——物理设计中最具挑战性的组件之一。Recursive 构建的工具与商业工具高度相关(高保真度),但速度快了 1000 倍

在展示中,她们对比了两种结果:

通过跨栈协同设计(Co-design Across the Stack),解锁了来自协同优化和自动化两方面的巨大性能提升和上市时间缩短。

"无设计":芯片设计领域的台积电时刻

Anna 和 Azalia 提出了一个极具雄心的类比框架:"无设计"(Designless),正如"无晶圆厂"(Fabless)。

台积电(TSMC)等代工厂的出现,使得英伟达(Nvidia)、苹果(Apple)等公司可以专注于芯片设计,而将制造委托给专业代工厂。Recursive 想要成为芯片设计领域的平台——公司可以专注于应用、建模和其他上层工作,而 Recursive 提供底层计算和硬件能力。

这将产生深远的影响:

今天,AI 推理领域只有少数几种主流芯片。但随着 AI 工作负载的爆炸式增长,性能需求将急剧膨胀。解锁性能的一个重要途径就是定制化(Customization)——为服务的工作负载构建真正定制的芯片。Recursive 想要成为赋能这一芯片多样性爆发的平台。

外星美学:AI 生成的芯片布局

在问答环节,有一个有趣的提问:AI 生成的芯片布局与人类专家的布局有什么不同?

Anna 展示了对比:人类专家的布局非常整齐、规则化——这是人类审美和思维方式的自然体现。但 AI 生成的布局呈现出有机的、弯曲的形状。这种看起来"外星化"的布局实际上最小化了线长(Wire Length),提高了性能——但当初次看到时,物理设计工程师们感到非常震惊。

这正是 Constantine 在主题演讲中提到的"外星设计"(Alien Design)理念的完美例证。

定制芯片的经济学

关于定制芯片的成本和规模经济问题,Azalia 给出了一个深刻的回答:通过大规模计算来缩短设计时间并提升芯片性能,Recursive 正在引入一个可调节的旋钮。对于前沿模型级别的 AI 工作负载——其运行规模之大,即使 1% 的性能提升也是巨大的收益。同时,在不同规模下有不同的性能增益。核心逻辑是:用计算来换取自动化和更好的性能

结语

Recursive 拥有一支独特的团队——由大语言模型(LLM)专家(曾在 Gemini、Grok 等项目工作过)和芯片设计专家混编而成。正如 Anna 所说:"这是一支非常棒的混合团队,我们很高兴能一起构建。"

在 AI 正在吞噬软件世界的时代,Recursive Intelligence 的命题切中了 AI 革命最底层的物理基础设施——让 AI 设计它自己的物理底座,从而完成从算法到硅片的递归自我改进循环。 如果成功,这不仅将加速 AI 本身的发展,更可能彻底改写半导体行业的竞争格局。