数据中心是新的计算单元:Crusoe CEO Chase Lochmiller解读AI基础设施革命

cover>

摘要

Crusoe CEO Chase Lochmiller与红杉合伙人David Cahn展开了一场关于AI底层基础设施的深度对话,将讨论焦点从GPU和AI模型拉回到更根本的物理世界——钢铁、服务器和电力。当Jensen Huang刚刚在同一个大会上描绘了数十万GPU集群的蓝图,Chase则揭示了这些集群背后真正在发生什么:在得克萨斯州Abilene,每天有5,000名工人昼夜不停地建设数据中心,为AI革命打造物理载体。

这场对话直面了David Cahn此前提出的"AI的6000亿美元问题"——有巨额资金正在被投入基础设施建设,但应用层收入尚未跟上这一投资节奏。Chase从三个层次回应了这一关切:首先,数据中心不再是简单的"放服务器的房子",而是正在成为整个AI计算范式的"新单元"——规划、建设和运营数据中心的复杂度已经堪比建设一座小型城市;其次,电力正在成为比GPU更稀缺的资源,数据中心的选址越来越由"哪里有可用的电力"而非"哪里离用户近"来决定;最后,AI基础设施的建设不是一个线性增长的过程,而是一个阶跃函数——当你从一个1万GPU的集群跳到30万GPU的集群时,你需要的不是30倍的投资,而是全新的工程范式。

正文

物理世界的AI革命:从钢铁与电力讲起

David Cahn以他标志性的直率开启了对话:"Jensen已经给我们讲了服务器。所以我们来聚焦钢铁和电力。"这并非调侃,而是一个深刻的观察:在围绕AI的讨论中,人们过分关注了模型架构、算法突破和应用场景,却忽略了将这些变成现实的物理基础设施。

Chase Lochmiller正是站在这个物理世界与数字世界交汇点上的关键人物。Crusoe不设计AI模型,不训练神经网络——他们建设和管理驱动这一切的物理设施。在得克萨斯州Abilene,每天有5,000名工人在工地上24小时轮班作业,加速AI基础设施的建设。

"也许跟大家聊聊,我们通常理解Jensen的服务器,我们知道它们要被放进数据中心,"David引导道,"但也许很多人并不真正理解这背后意味着什么。"

数据中心的范式跃迁:从建筑到城市

Chase解释了数据中心正在经历的根本性变化。传统数据中心(Hyperscale Data Center)的设计容量通常在几十兆瓦(MW)级别。而今天,AI数据中心的需求正在跃升至吉瓦(GW)级别——千倍的跃升。

"当你从30兆瓦跳到300兆瓦再到1吉瓦,"Chase解释道,"你不再是在建一栋建筑——你是在规划一座小型城市。"电力基础设施需要与当地电网进行全新的协调,往往需要专用的变电站和输电线路;冷却系统的设计从"每机架几十千瓦"跃升到"每机架数百千瓦"——这意味着从风冷到液冷(Liquid Cooling)的跨越;物理安全、消防安全、网络冗余——所有传统数据中心的设计准则都在这个量级被重新定义。

"Crusoe之所以在这个领域有独特优势,"Chase补充道,"是因为我们从一开始就不是在传统数据中心选址上建设的。我们一直在偏远地区、在能源丰富但远离传统数据枢纽的地方运营。这给了我们一套完全不同的工程DNA。"

电力:比GPU更稀缺的资源

对话中最引人深思的结论之一来自Chase对电力约束的分析。"如果你看全球数据中心的电力消耗预测曲线,"他指出,"你会发现我们正在进入一个根本性的供需失衡时期。"

电力之所以成为瓶颈,不仅仅是因为数据中心本身的需求在激增。更深层的原因在于三个因素的交汇:

电网扩容的物理时滞:新建一座发电厂或一条高压输电线路需要5到10年的时间——从环境评估、土地征收、设计审批到物理施工,没有任何方法可以显著加速这个过程。而AI基础设施的需求增长速度则是以月为单位计量的。

全球能源转型的双重压力:数据中心需要大量电力,而全球正在推动从化石燃料向可再生能源的转型。这意味着新建电力供应不仅要满足增量需求,还要替代退役的传统能源产能。

选址逻辑的根本改变:传统上,数据中心建在靠近用户的地方以降低网络延迟。但在AI时代,90%的计算是训练和批量推理——延迟不敏感。这使得数据中心的选址逻辑变成了"哪里有可用的、廉价的、大规模的电力",而不是"哪里离用户近"。

AI的6000亿美元问题:Chase的回应

David Cahn此前因提出"AI的6000亿美元问题"而在行业内引发广泛讨论——他的核心观察是,流向AI基础设施(数据中心、GPU、电力)的资本支出已经达到天文数字,但应用层产生的收入尚未形成匹配的增长节奏。这是否意味着泡沫?

Chase给出了一个务实的回应。他承认这一担忧在短期内有其合理性——基础设施投资与收入回报之间存在自然的时间差,而这个时间差在AI领域尤其显著。但他同时提供了三个缓解担忧的论据:

基础设施是瓶颈而非泡沫:当前最大的制约因素不是需求不足,而是供给不足。企业排队等候GPU配额和可用电力——这恰好表明市场紧张是由供给侧而非需求侧驱动的。

价值创造的分布是不均匀的:确实有很多AI应用尚未找到产品市场匹配(Product-Market Fit),但成功的案例——无论是在代码生成、药物发现还是客户服务领域——正在以惊人的速度创造价值。基础设施投资最终会找到回报路径,即使某些具体的应用方向会失败。

阶跃函数的非线性:AI基础设施投资呈现的指数增长特征,常常被误读为"过度投资"。但在实践中,每一代基础设施的跃升——从1万GPU到10万GPU到百万GPU——打开的不仅是更大的算力,而是全新的应用可能性。这些可能性的经济价值无法通过线性外推来计算。

数据中心即产品的思维

Chase在对话中透露了Crusoe的核心哲学:将数据中心本身视为一个产品,而不仅仅是一个房地产项目或基础设施资产。

这一理念意味着:数据中心需要像软件产品一样快速迭代——每个新站点都应比上一个更高效、更可靠、更快速部署;运营数据需要被系统性地收集和分析,以驱动持续优化;客户体验(在数据中心语境下,客户是那些租用算力的AI公司和云服务商)需要被放在核心位置。

"传统数据中心行业的交货周期是18到24个月,"Chase指出,"我们正在将其压缩到12个月以内。这不是通过偷工减料实现的,而是通过完全重新思考设计、采购和建设流程来实现的。"

未来展望:AI基础设施的下一个十年

当被问及AI基础设施的未来形态时,Chase描绘了一个多层次的演进图景:

短期(1-3年):电力约束将成为主导因素。能够在电力丰富地区(如得克萨斯州、北欧、中东部分地区)快速部署大型数据中心的企业将获得结构性优势。同时,液冷技术将从"可选方案"变成"标配"。

中期(3-7年):数据中心的能源自给将成为一个战略方向。现场发电(On-site Generation)——无论是天然气、核能还是大规模太阳能+储能——将让数据中心从"电网消费者"转变为"能源生态系统的积极参与者"。

长期(7-15年):AI基础设施的地理分布将发生根本性变化。随着推理需求的增长超过训练需求,低延迟的需求将重新浮现,催生分布更广、规模更小但数量更多的边缘数据中心。与此同时,超大规模训练集群将持续向更极端的方向演进,可能达到单一站点容纳数百万GPU的规模。

"无论AI的未来走向何方,"Chase总结道,"有一件事是确定的:它需要物理世界的承载。钢铁、混凝土、铜线、变压器、发电机——这些不是AI故事中不起眼的配角,而是这个故事的主角。数据中心不是'放AI的地方',数据中心就是AI的物理形态。"