以AI攻克所有疾病:Isomorphic Labs Max Jaderberg的探索之路

摘要
Isomorphic Labs首席AI官Max Jaderberg深度阐述了一个宏大的愿景:利用人工智能构建通用药物设计引擎(General Drug Design Engine),从根本上变革药物发现范式。这家从DeepMind孵化而出的公司,并非专注于单一靶点或特定疾病领域,而是着眼于打造一个可反复应用于任何疾病领域、任何药物模态的AI平台。
Max回顾了他在DeepMind深耕深度强化学习(Deep Reinforcement Learning)的十年历程,从Atari游戏到《星际争霸II》的AlphaStar和《雷神之锤III》的Capture the Flag,揭示了这些游戏研究如何为今天的AI药物设计奠定基础。他详细解释了AlphaFold 3的突破——不仅预测蛋白质结构,更建模了蛋白质与小分子、DNA、RNA等所有生物分子间的相互作用,这一成就为化学家打开了全新设计空间。
Max提出了一个引人深思的类比:药物设计的"GPT-3时刻"将不是像语言模型那样生成人类可理解的内容,而是更像AlphaGo的"第37手"(Move 37)——一个超越人类理解范畴、却在物理世界中真实有效的创造性突破。他预测,我们即将看到AI生成的设计方案令人类药物设计师感到困惑,却在实验中证明其正确性,这将是AI药物设计超越人类创造力的关键时刻。文章还深入探讨了构建跨学科团队的方法论、合成数据(Synthetic Data)在化学领域的巨大潜力,以及实现"端到端药物设计"需要约半打类似AlphaFold级别的突破的实事求是判断。
正文
从强化学习到药物发现:一条意想不到的道路
Max Jaderberg的学术和职业生涯始终贯穿着一个核心命题:如何让AI能够执行任何人类想要它完成的任务。在DeepMind的早期岁月,监督学习(Supervised Learning)是主导范式——你需要知道问题的答案才能训练模型。但Max被强化学习所吸引,因为在强化学习中,你只需要能够判断模型给出的答案是好是坏,而不需要预先知道正确答案本身。
"世界上有太多问题我们不知道答案是什么,"Max指出,"AI真正的前沿在于将其应用于人类尚不知道如何解决的领域,或者人类表现已经达到极限的领域。而这正是强化学习展现出真正前景的地方。"
这一理念驱动着DeepMind从Atari游戏一路向上攀登。在攻克了《乓》(Pong)和《太空侵略者》(Space Invaders)等简单游戏后,研究团队开始寻找更复杂的测试场。视频游戏之所以成为AI研究的理想平台,在于它们是"可塑的、完美封装的世界"——研究人员可以操纵环境、测试不同算法、设置各种情境。
AlphaStar与Capture the Flag:迈向通用智能的关键一步
当被问及为何选择《星际争霸II》和《雷神之锤III》作为研究对象时,Max揭示了一个更深层的考量:"作为一个强化学习研究者,你总是在想:好,我们攻克了Atari,下一个更复杂的游戏是什么?"
他个人痴迷于一个概念:零样本泛化(Zero-shot Generalization)——即智能体能够不经专门训练就处理全新任务。这与当时主流的Atari研究范式截然不同,后者通常是为每个游戏从头训练一个专门的智能体。通过Capture the Flag项目,团队证明了AI智能体可以在从未见过的地图上、与从未合作过的队友一起、对抗从未遇到过的对手,展现出人类级别的泛化能力。
"这些核心构建模块——无论是2012年计算机视觉中的卷积神经网络,还是早期的生成模型、语言模型、强化学习——一遍又一遍地被证明是通用的,"Max总结道,"你把出色的人才、出色的算法、充足的计算力,对准真正具有挑战性的问题,就能找到攻克它们的配方。我一次又一次地见证了这一点。"
AlphaFold 3:从结构预测到药物设计的桥梁
Max以简洁优雅的方式解释了药物设计的基本原理:人体内的蛋白质是生命的基本构建模块,它们通过相互作用形成分子机器。小分子药物通过附着到特定蛋白质上,干扰或增强其正常功能来发挥治疗作用。因此,理解小分子如何与蛋白质相互作用——它们形成什么样的结构、产生什么样的物理相互作用——是药物设计的核心。
AlphaFold 3正是在这一关键点上实现了突破。它不仅预测蛋白质的结构,更建模了蛋白质与小分子、DNA、RNA等所有生物分子构建模块之间的相互作用。"这基本上打开了药物设计核心部分的结构理解能力,"Max强调,"它开启了全新的靶点类别——比如转录因子(Transcription Factors),这些传统上被认为是不可成药的靶点。"
然而,Max也坦诚地指出了一个现实:单靠AlphaFold 3远远不够。"药物设计极其困难,它不是单一问题。你不仅需要理解蛋白质的结构,不仅需要设计一个能以你想要的方式调节蛋白质的分子,你还需要这个分子能够以药片形式被服用、在体内正确吸收、到达正确的细胞类型、进入细胞内部、不被肝脏以某种方式分解……"
他估计,要实现真正变革性的药物设计能力,大约需要"半打"类似AlphaFold级别的突破——在生物学和化学的不同核心概念上达到实验级精度。
端到端药物设计:搜索10的60次方分子空间
Max阐述了Isomorphic Labs的终极愿景——构建一个"端到端药物设计引擎"。当前的小分子药物设计空间包含大约10的60次方种可能的分子结构,这是一个天文数字。在这个巨大的空间中搜索最优解,既需要生成式模型(Generative Models)来创造候选分子,也需要能够学习和探索整个设计空间的AI智能体(Agents)。
"我们正在追求的,就是创造这样一个通用的药物设计引擎,"Max说,"不是为某个特定靶点或某个特定疾病,而是可以反复应用于任何不同疾病领域的东西。"
他详细解释了Isomorphic Labs的运作模式:公司内部有多个自有项目,从靶点识别到先导化合物优化,全方位推进;同时与制药巨头建立合作伙伴关系,如与礼来(Eli Lilly)和诺华(Novartis)的合作——"这不是那种'我们试试看'的问题,这些是诺华已经深耕了十多年的真正难题。"2024年,这些合作取得了显著进展,诺华甚至扩展了与Isomorphic的合作,这是对早期成功的最有力证明。
合成数据:化学领域的秘密武器
在数据方面,Max是合成数据(Synthetic Data)的坚定拥护者,这一立场可以追溯到他博士时期。"当我还是博士生时,我只能接触到几千张图像,而谷歌有数百万张。所以我就生成了大量合成数据,这打通了瓶颈。"
在化学领域,这一策略的优势更加明显。化学和生物学拥有扎实的理论基础——量子化学和量子力学的理论框架可以被用来构建模拟器,进而生成海量合成数据。生成式模型本身也可以创造数据,并通过评分系统来提升数据的信息含量。
但Max也指出了一个关键的开放领域:体内数据(In Vivo Data)——即通常在真实动物(如小鼠或大鼠)身上测量的数据。"你无法大规模生成这种数据,完全没有办法。"这为新型数据生成技术创造了巨大机遇,比如器官芯片(Organoids on a Chip)等前沿技术,可以在芯片上完成传统上需要活体动物才能进行的测量。
跨学科团队:创造一门新科学
"AI药物设计这个领域存在的时间并不长,所以找到一个既是药物设计世界级专家、又是机器学习世界级专家的人的概率基本为零。"Max的这一观察揭示了组建团队的核心挑战。
Isomorphic的解决方案是将两个领域的顶级人才汇聚一堂,创造出一种新的合作文化。"我真心认为Isomorphic正在孕育一门新的科学领域,"Max说,"因为我们拥有真正生活在AI与药物设计交叉点上的人。"
他特别强调从外部引入"外行人"的价值——那些不具备传统药物发现背景、因而能对长期存在的假设提出挑战的人。"那些在某个领域深耕了30年的人可能会错过一些东西,因为他们有太多的隐性知识和假设。拥有'初学者心态'带来了巨大的价值。"
AlphaFold的开放科学与未来发展
AlphaFold有着悠久的开源和学术使用传统。随着AlphaFold 3这一最新突破的发布,确保科学界能够获取这一功能变得尤为重要——不仅因为它在药物设计中极具价值,更因为它在基础生物学和生命科学理解方面有着广泛的应用前景。
"人们正在以非常有创意的方式使用我们的AlphaFold 3服务器和模型,"Max分享道。对于未来,他的野心毫不掩饰:"在我的脑海里,我想彻底解决结构预测这个问题。AlphaFold 3是这条路上的精彩一步,但它还不是100%的准确度——而当你开始推动科学边界时,问题会不断扩展为更多的问题,这正是做科学的令人上瘾之处。"
未来的方向还包括从静态结构向动态结构延伸——AlphaFold 3建模的是晶态结构,而蛋白质在体内是动态运动的。"我们正在从过去看向未来。"
Move 37时刻:AI药物设计的GPT-3时刻
在Max看来,AI药物设计的突破性时刻将与语言模型的"GPT-3时刻"有着本质不同。"在语言领域,当模型生成人类水平的内容时,我们能理解它,因为语言是人类派生的。但化学和生物学中的许多问题,我们人类自己都难以理解。"
因此,AI药物设计的里程碑不会像GPT-3那样——生成一篇你读了之后说"这真不错"的文章,而会更像AlphaGo对阵李世石时的"第37手"——这个走法震惊了整个围棋界,因为在人类数千年围棋历史中从未有人下过这一步。它看起来像个错误,令人类无法理解,但随着棋局的展开,这恰恰是AlphaGo击败李世石的关键一手。
"我们将看到大量类似的行为从这些模型中涌现,"Max兴奋地说,"特别是当我们将其应用于人类理解范围之外的事物,比如化学和生物学。"事实上,Isomorphic内部已经出现了这样的苗头——他们的生成式模型创造出的设计方案让人类药物设计师感到怀疑,但在物理实验中,模型是正确的,而人类是错的。
"当模型开始展现出超越人类的创造力元素,那将是令人震撼的。"
AI药物何时进入临床?
对于"何时能看到第一个AI生成药物进入临床"这个问题,Max给出了一个既有野心又实事求是的回答。他指出,传统药物发现从靶点识别到进入临床通常需要5到6年时间。"我们正在尝试大幅压缩这个时间线。"
Isomorphic目前已经将分子推进到了体外和体内实验阶段,这证明模型真正具备了设计能力。随着这些分子的不断推进,它们将进入更正式的临床前开发阶段。"我们不太想给出精确的时间表,"Max谨慎地表示,"但我们正在看到的信号——特别是这些模型设计的分子在真实实验中验证的信号——让我们感到兴奋。"
他对未来充满信心,描绘了一个"完全AI原生的制药工业"愿景:在这个未来中,人类不会消失——因为药物是为人类设计的,需要人类的反馈和判断——但整个工业将围绕AI能力进行重组。就像Farma(制药公司)这个词本身从"药物"到"农场"的语义演变一样,它最终将不再是"是制药公司还是AI"的问题,而是两者合而为一。整个行业都将适应这一变革。