为什么大脑的计算效率是 GPU 的 100 万倍：Unconventional AI 的 Naveen Rao

cover Sequoia Capital · 2026-05-06🎬 在 YouTube 观看原视频 →>

摘要

Naveen Rao 是 AI 芯片领域的先驱——他在"AI 芯片"这个词流行之前就创办了最早的 AI 芯片公司之一，后来创立了 Mosaic ML 并领导了 Databricks 的 AI 业务。如今，他带着三十年的思考重返神经科学领域，创办了 Unconventional AI，致力于从物理学层面重新定义计算的根本方式。他的核心论点令人震撼：我们今天的数字计算机——建立在 80 年前的冯·诺依曼架构之上——在能效方面距离理论上限差了三到四个数量级。而经过 40 亿年进化的大自然，已经创造出效率高得多的计算系统：人类大脑仅需 20 瓦。相比之下，运行一个大型 AI 模型可能需要吉瓦级别的能量。Naveen 的解决方案是摒弃矩阵运算和浮点数，转而利用非线性动力学（non-linear dynamics）——让物理学本身来完成计算，而非反复读写状态。他的团队在 6 个月内（借助 AI 的力量）从零开始完成了原型芯片的设计，演示了基于动力学系统的图像生成。如果成功，这可能重新定义我们对"计算机"的理解。

正文

ASI 需要百万倍能效提升

Naveen 开场就在屏幕上放了一句话："ASI（人工超级智能）是不可能的——因为我们需要一百万倍的计算能效提升。" 他笑着对听众说："我可以保证，你们中的一些人现在正在试图证明我是错的。"

他的逻辑非常清晰：我们正在迅速逼近能源上限。目前全球 AI 推理和训练已经消耗数吉瓦的电力。在未来两到四年内——不是十年后——我们将面临全球电力不足以支撑 AI 的困境。"我们选择了 80 年前的计算路径。想想看，在科技行业，有多少东西存在了 80 年？没多少。数字抽象、浮点数——这些东西从 20 世纪 40 年代就有了。它们是为完全不同的物理基底、完全不同的目的而设计的。现在我们正在建造智能机器——难道不该重新思考吗？"

全球 80 亿人的大脑各消耗约 20 瓦，全人类大脑总共只消耗 160 吉瓦。相比之下，全球发电能力约为 9000 吉瓦。看起来似乎还有余量——但问题是，当前的数字计算范式极其低效。一个大模型推理所需的能量在兆瓦到吉瓦级别，而人脑只用 20 瓦。

生物学提供了存在证明

"一只松鼠在树枝间跳跃——它的脑功耗不到 10 毫瓦。也就是你手机功耗的百分之一。我们无法用大得多的计算机完美地做到这件事——在风中跳跃 10 英尺，从一根树枝到另一根。"

Naveen 展示了一条热力学效率曲线：存在一个基于 Landauer 原理的物理极限——"每瓦智能"的理论上限。生物学已经非常接近这个上限，但仍有大约两个数量级的提升空间。而我们今天的数字芯片（基于二维光刻）则处于曲线的底部，距离生物学有三到四个数量级的差距。

大脑如何计算：非线性动力学

作为一位计算神经科学家和前计算机架构师，Naveen 已经思考这个问题 30 年了。他认为大脑的计算方式与数字计算机根本不同：

大脑不使用矩阵运算。它使用非线性动力学。 神经元之间存在时变的交互——这就是计算发生的地方。此外，大脑是随机的——它不像数字计算机那样严格依赖 0 和 1，如果一个比特位出错整个系统就会崩溃。

他用 Kuramoto 同步现象来说明：一组耦合振子会自发地从任意初始状态收敛到同步状态。如果我们让耦合变得可训练（trainable coupling），系统就能展现出极其丰富的动力学行为——可以在状态空间中沿着任意轨迹移动。这就是他们芯片设计的理论基础。

让物理自己计算

传统冯·诺依曼架构的计算方式：读取状态 → 操作 → 写回状态 → 循环往复。Naveen 指出，这正是现有计算系统消耗大部分能量的地方——不断在内存和处理器之间搬运数据。

而基于非线性动力学的系统则完全不同："只需设定初始状态，推动一下，然后让它自然演化。物理本身完成计算，状态是隐式的（implicit），不需要显式读写。"

"如果你只能从这次演讲中带走一件事，那就是：我们利用物理学的时间轴来进行计算——而现有的计算架构不这样做。"

六个月从零到原型芯片

Naveen 展示了一个正在建造中的实际芯片——"我们将在今年夏天流片。" 从今年 1 月几乎零团队开始，到完整的原型只用了 6 个月。"这就是没有包袱的好处——你可以用完全不同的方式做事。而这之所以可能，是因为 AI。"

在现场演示中，他展示了一个在动力学系统模型上运行的图像生成示例。系统通过反向传播将随机噪声引导至特定的图像类别（如"猫"或"马"），然后让动力学自然演化——生成的图像会在马的不同形态之间平滑过渡，展现了系统已在状态空间中学习到了有意义的概念表示。

真正的非冯·诺依曼架构

Naveen 最后总结了计算范式演进的阶梯：CPU（单线程快）→ GPU（并行矩阵运算）→ 存内计算（Groq 等）→ 动力学系统——状态与函数重叠在物理本身之中，不再有状态与计算的分离。"计算效率当然会提升——'Galaxy Brain' 指数也会提升。这才是真正的非冯·诺依曼架构。"

他引用了一句贯穿其职业生涯的名言："我们无法用创造问题时的思维方式来解决问题。" 在思考了这个问题 30 年后，Naveen 认为现在正是时候——"因为现在我们终于可以建造大脑了。"