OpenAI 研究员 Dan Roberts：物理学能为人工智能教会我们什么

cover Sequoia Capital · 2024-10-22🎬 在 YouTube 观看原视频 →>

摘要

Dan Roberts 是一位量子物理学家，曾在本科阶段研究"隐形斗篷"，在 MIT 获得博士学位，并在普林斯顿高等研究院（IAS）完成博士后研究。他于 2024 年加入 OpenAI，成为 o1（代号"草莓"）模型的核心贡献者。在本期对话中，Dan 从物理学家的视角出发，深入探讨了两个核心问题：物理学能为人工智能（AI）教会我们什么，以及 AI 又能反过来教会我们关于物理和数学的什么。

Dan 认为，物理学家之所以大量涌入 AI 领域，并非偶然。物理学的核心方法论——理论与实验之间的紧密反馈循环、通过统计平均从微观行为推导宏观规律的能力——与理解大规模深度学习系统所需的方法高度契合。他将深度学习中的"微观视角"（神经元、权重、偏置）与"宏观视角"（模型输出的诗歌、数学证明）之间的关系，类比为分子运动与热力学之间的关系。他相信我们能够真正理解这些 AI 系统，而非将其视为无法解释的"黑箱"。

关于规模化法则（Scaling Laws），Dan 指出纯粹依赖规模扩张终将面临经济上限，真正的突破需要超越规模的思想创新——这也是他加入 OpenAI 的原因。他认为数学问题因其"受约束"的特性可能比物理问题更容易被 AI 攻克，而物理学的开放性问题（如量子引力、黑洞内部发生了什么）则需要一种完全不同的 AI 方法。Dan 还分享了他独特的写作哲学：他写论文的目的是为了讲笑话，科学成果不过是包装笑话的载体。

正文

从好奇的孩子到量子物理学家

Dan Roberts 将自己成为理论物理学家的原因归结为一个简单的特质：他是一个从未长大的、总是追问"为什么"的"讨厌的三岁小孩"。他 19 个月大的儿子如今正表现出同样的好奇心——跟着洗衣机维修工转悠，非要看看洗衣机内部是什么样子。Dan 认为，当你更偏向定量思维而非定性思辨时，你会自然地转向物理学而非哲学——你想知道这个世界如何运转，想知道所有那些"外在的东西"到底是什么。

但真正的问题——"所有这些内在的东西（意识、思维）是什么"——在他看来更偏向人文学科，不够定量化。而 AI 的出现改变了这一点：AI 系统让我们可以用几行 Python 代码构建出能够做人类所做的事情（识别猫、写诗）的系统，并从头到尾追踪理解它们的工作原理。相比之下，研究人类智能需要跨越生物学、神经科学、心理学等多个层级——这种复杂性让 AI 成为了一个更容易研究的智能"样本"。

从"如果-那么"到机器学习

Dan 在本科时修过一门 AI 课程，但那时的 AI 是传统的"老派 AI"（Good Old-Fashioned AI）——大量基于"如果发生 A，就执行 B"的硬编码逻辑。他当时对此并不感冒，甚至一度放弃了 AI。但仅仅一两年后，他在英国读研究生时发现了机器学习——一种基于数据和统计的 AI 方法。这种方法的灵活性在于：你不需要为每一种情况编写规则，而是提供一个可以适应数据样本的"柔性"算法。

2012 年是深度学习的大年，Dan 恰好赶上了这波浪潮。机器学习的方法论让他感到熟悉——它大量借鉴了物理学的数学工具和思维方式。他意识到，这与他在物理学中习惯的研究框架高度一致。

为什么物理学家涌入 AI？

Dan 认为，物理学家"入侵"各个领域是一个历史悠久的传统——我们总是拿着自己的"锤子"去敲各种可能不是钉子的问题。历史上，物理学家曾大量涌入量化金融、数据科学。如今，AI/机器学习成为了新的目的地，因为它不仅是一个激动人心的研究问题，而且在方法论上与物理学高度相似。

物理学的核心工作方式——提出一个基于理论直觉的模型，通过大量实验验证或推翻它，在数据和理论之间形成紧密的反馈循环——这与研究大规模深度学习系统的方式如出一辙。物理学家习惯的数学工具（概率论、统计力学、信息论）恰好是理解神经网络的理想工具。正如蒸汽机的工程实践催生了热力学理论，深度学习的工程实践也需要类似的理论框架来理解。

微观视角与宏观视角：分子与热力学的类比

Dan 和他的同事 Sho Yaida、Boris Hanin 合著了一本书，试图将统计物理学的思想应用于深度学习。其核心理念是：深度学习系统中存在着类似于"分子"（微观）和"热力学"（宏观）的分层结构。

微观层面是神经元、权重、偏置——这些具体的数字和连接。宏观层面则是模型的行为——它能写诗吗？能解决数学问题吗？统计物理学的成功之处在于，我们能够从分子的统计行为出发，严格推导出宏观的热力学定律（如理想气体定律），甚至进一步推导出对理想模型的修正。Dan 认为，类似的方法论可以应用于理解 AI 系统——从参数的行为推导出模型的能力。

规模化法则的极限与思想的角色

当被问及 Andrej Karpathy 提出的"当前 AI 系统比生物神经网络效率低五到六个数量级"的观点时，Dan 区分了两个不同的问题。第一个问题是人类学习效率远高于 LLM——一个幼儿只需接触远少于万亿级别的 token 就能开口说话。他认为弥合这一差距需要"非平凡的想法"（nontrivial ideas）。

第二个问题涉及规模化法则的极限。GPT-4 之后还会有 GPT-5、GPT-6、GPT-7，但纯粹的规模化终将撞上经济天花板——训练一个价值超过全球 GDP 的模型是不现实的。因此，Dan 认为他加入 OpenAI 的原因正是相信在规模化之外还有高杠杆的思想创新空间。

关于 Richard Sutton 的《苦涩的教训》（The Bitter Lesson）——这篇著名文章论证了思想不重要、规模才是一切——Dan 持平衡的观点。他认为 Transformer 本身就是"为适应当时硬件而设计的好思想"，而深度学习、感知器（Perceptron）等概念也都是历经数十年积累的重要思想突破。规模化和思想创新之间不是非此即彼，而是一种协同关系。

我们能否真正理解 AI？

Dan 在 AI 社区中的"逆向观点"（contrarian position）是：我们能够真正理解这些 AI 系统，而不是将其视为不可解释的黑箱。他的信心来源于物理学处理极度复杂系统的成功经验。物理学中的一个核心原则是"大尺度极端简化"——由于统计平均效应（中心极限定理），大规模系统的行为往往可以用简单的规律描述。

当然，Dan 并非声称大语言模型（Large Language Model，LLM）会完美遵循同样的规律，但他相信物理学的工具箱——理论建模、实验验证、简化假设——可以帮助我们取得理解 AI 系统的实质性进展。他展望未来，希望 AI 工具（而非自主行动的"智能体"）能够帮助人类加速这一理解过程。

AI 能为物理学和数学做什么？

Dan 对 AI 在数学领域的应用更为乐观，因为数学问题更加"受约束"（constrained）。在棋类游戏中，AI 已经展示了超越模式匹配的能力——通过"推理时计算"（Inference Time Compute）进行向前模拟和搜索，而非仅依赖训练时学到的直觉。数学中的许多问题（如寻找证明路径）具有类似的"游戏"特征——存在明确的"下一步"和胜负判断标准。这使得数学成为 AI 推理能力自然延伸的领域。

物理学的情况则更为复杂。物理学家关心的问题（如量子引力、黑洞内部发生了什么）并不像"给定一个问题，生成对应答案"那样简单。物理研究的过程更像是在黑板上聊天、画草图、进行非正式的推理——数据的形态更像是随机的邮件、Slack 对话和草稿纸上的涂鸦。因此，AI 帮助物理学的方式可能需要完全不同的设计思路。

不过，Dan 仍然乐观地认为 AI 工具（如帮助理解新论文、加速文献调研）将在短期内对物理学家产生巨大影响——就像 Mathematica 能够计算积分一样，AI 将成为物理学家的得力助手。

"我写论文是为了笑话"

Dan 的写作风格以轻松幽默著称，这与大多数技术论文的严肃风格形成鲜明对比。他解释这是一种刻意的选择。在一次午餐对话中，他告诉普林斯顿高等研究院的教授 Nati Seiberg："我写论文的理由是为了笑话——你有一些想讲的笑话，然后你需要一个科学产品来包装它们，让人们被迫读到这些笑话。"

Seiberg 困惑地问："为什么不直接做科学？为什么要笑话？"Dan 坚持认为笑话和科学同样重要。他的写作哲学是：你学习了科学方法和正式规则，但随着成长，你意识到这些规则是可以打破的。最终的目标是让读者愿意读、能理解、并享受阅读过程——如果文章更有趣，人们就更有可能读完并理解其中的观点。

短中长期展望

Dan 对未来五年的预测是：规模化终将触顶，而届时的结果可能是两极化的——要么 AI 达到乌托邦式的后经济时代，要么我们将发现需要大量新思想的 AI 寒冬。他最期待的是看到 GPT-4 到下一代模型之间的"增量"——只有拥有多个数据点，我们才能真正评估技术进步的速度。

Dan 以物理学家的幽默结束了对话："在物理学中只有三个数字——零、一和无穷大。其他数字都不重要。"这句玩笑话既体现了他对物理学的热爱，也反映了他面对不确定未来时的轻松态度。