为什么大脑的计算效率是 GPU 的 100 万倍:Unconventional AI 的 Naveen Rao

cover>

摘要

Naveen Rao 是 AI 芯片领域的先驱——他在"AI 芯片"这个词流行之前就创办了最早的 AI 芯片公司之一,后来创立了 Mosaic ML 并领导了 Databricks 的 AI 业务。如今,他带着三十年的思考重返神经科学领域,创办了 Unconventional AI,致力于从物理学层面重新定义计算的根本方式。他的核心论点令人震撼:我们今天的数字计算机——建立在 80 年前的冯·诺依曼架构之上——在能效方面距离理论上限差了三到四个数量级。而经过 40 亿年进化的大自然,已经创造出效率高得多的计算系统:人类大脑仅需 20 瓦。相比之下,运行一个大型 AI 模型可能需要吉瓦级别的能量。Naveen 的解决方案是摒弃矩阵运算和浮点数,转而利用非线性动力学(non-linear dynamics)——让物理学本身来完成计算,而非反复读写状态。他的团队在 6 个月内(借助 AI 的力量)从零开始完成了原型芯片的设计,演示了基于动力学系统的图像生成。如果成功,这可能重新定义我们对"计算机"的理解。

正文

ASI 需要百万倍能效提升

Naveen 开场就在屏幕上放了一句话:"ASI(人工超级智能)是不可能的——因为我们需要一百万倍的计算能效提升。" 他笑着对听众说:"我可以保证,你们中的一些人现在正在试图证明我是错的。"

他的逻辑非常清晰:我们正在迅速逼近能源上限。目前全球 AI 推理和训练已经消耗数吉瓦的电力。在未来两到四年内——不是十年后——我们将面临全球电力不足以支撑 AI 的困境。"我们选择了 80 年前的计算路径。想想看,在科技行业,有多少东西存在了 80 年?没多少。数字抽象、浮点数——这些东西从 20 世纪 40 年代就有了。它们是为完全不同的物理基底、完全不同的目的而设计的。现在我们正在建造智能机器——难道不该重新思考吗?"

全球 80 亿人的大脑各消耗约 20 瓦,全人类大脑总共只消耗 160 吉瓦。相比之下,全球发电能力约为 9000 吉瓦。看起来似乎还有余量——但问题是,当前的数字计算范式极其低效。一个大模型推理所需的能量在兆瓦到吉瓦级别,而人脑只用 20 瓦。

生物学提供了存在证明

"一只松鼠在树枝间跳跃——它的脑功耗不到 10 毫瓦。也就是你手机功耗的百分之一。我们无法用大得多的计算机完美地做到这件事——在风中跳跃 10 英尺,从一根树枝到另一根。"

Naveen 展示了一条热力学效率曲线:存在一个基于 Landauer 原理的物理极限——"每瓦智能"的理论上限。生物学已经非常接近这个上限,但仍有大约两个数量级的提升空间。而我们今天的数字芯片(基于二维光刻)则处于曲线的底部,距离生物学有三到四个数量级的差距。

大脑如何计算:非线性动力学

作为一位计算神经科学家和前计算机架构师,Naveen 已经思考这个问题 30 年了。他认为大脑的计算方式与数字计算机根本不同:

大脑不使用矩阵运算。它使用非线性动力学。 神经元之间存在时变的交互——这就是计算发生的地方。此外,大脑是随机的——它不像数字计算机那样严格依赖 0 和 1,如果一个比特位出错整个系统就会崩溃。

他用 Kuramoto 同步现象来说明:一组耦合振子会自发地从任意初始状态收敛到同步状态。如果我们让耦合变得可训练(trainable coupling),系统就能展现出极其丰富的动力学行为——可以在状态空间中沿着任意轨迹移动。这就是他们芯片设计的理论基础。

让物理自己计算

传统冯·诺依曼架构的计算方式:读取状态 → 操作 → 写回状态 → 循环往复。Naveen 指出,这正是现有计算系统消耗大部分能量的地方——不断在内存和处理器之间搬运数据。

而基于非线性动力学的系统则完全不同:"只需设定初始状态,推动一下,然后让它自然演化。物理本身完成计算,状态是隐式的(implicit),不需要显式读写。"

"如果你只能从这次演讲中带走一件事,那就是:我们利用物理学的时间轴来进行计算——而现有的计算架构不这样做。"

六个月从零到原型芯片

Naveen 展示了一个正在建造中的实际芯片——"我们将在今年夏天流片。" 从今年 1 月几乎零团队开始,到完整的原型只用了 6 个月。"这就是没有包袱的好处——你可以用完全不同的方式做事。而这之所以可能,是因为 AI。"

在现场演示中,他展示了一个在动力学系统模型上运行的图像生成示例。系统通过反向传播将随机噪声引导至特定的图像类别(如"猫"或"马"),然后让动力学自然演化——生成的图像会在马的不同形态之间平滑过渡,展现了系统已在状态空间中学习到了有意义的概念表示。

真正的非冯·诺依曼架构

Naveen 最后总结了计算范式演进的阶梯:CPU(单线程快)→ GPU(并行矩阵运算)→ 存内计算(Groq 等)→ 动力学系统——状态与函数重叠在物理本身之中,不再有状态与计算的分离。"计算效率当然会提升——'Galaxy Brain' 指数也会提升。这才是真正的非冯·诺依曼架构。"

他引用了一句贯穿其职业生涯的名言:"我们无法用创造问题时的思维方式来解决问题。" 在思考了这个问题 30 年后,Naveen 认为现在正是时候——"因为现在我们终于可以建造大脑了。"