为什么数据才是真正的 AI 瓶颈:Flapping Airplanes 的 Ben 和 Asher Spector

cover>

摘要

Ben Spector 和 Asher Spector 是一对兄弟——都是斯坦福博士——他们联合创立的 Flapping Airplanes 提出了一个在算力军备竞赛声浪中被忽视的关键命题:数据效率(Data Efficiency)才是 AI 真正的瓶颈。 在 Sequoia AI Ascent 2026 上,兄弟俩从三个维度论证了这一观点:(1) 经济维度——当前 LLM 在搜索和编程上表现出色,因为这些任务拥有整个互联网级别的"富数据"资源,但更广泛的经济体——机器人、金融交易、科学发现——数据极其稀缺,而正是这些领域代表着数万亿的市场机会;(2) 规模维度——算力(FLOPS)以指数级速度变得更便宜,而高质量数据的收集面临监管、谈判、隐私等结构性障碍,远不如算力同质化和可规模化;(3) 哲学维度——数据是 AI 世界的护城河(会议现场投票显示此为共识),数据效率是实现更广泛竞争、让更多公司参与 AI 革命的关键。他们的技术路径是从底层硬件原语(Hardware Primitives)出发——超越 PyTorch 等现有框架的表达限制,直接"榨干"GPU 的能力,通过细粒度并行和全新算法设计来大幅提升数据效率。正如 Ben 所说:"我们试图用以前从未有过的方式'虐待'GPU。"

正文

"我们不是航空公司":一对兄弟的澄清

Flapping Airplanes 的名字一开始就制造了一个意外的笑点。公司三个月前宣布成立后,收到了大量来自航空业的联系——"人们试图卖给我们跑道、飞机零件、风洞……不是风险投资意义上的 runway,是字面意义上的跑道。"

Asher 不得不在演讲开头郑重澄清:"我们不是一家航空公司,我们是一个 AI 实验室。"

澄清归澄清,但 Ben 和 Asher 的背景远非玩票:Ben 在斯坦福花了三年时间"深陷内核矿井",编写极低层次的 GPU 系统代码;Asher 同样是斯坦福博士,曾在 Cursor 和 Mercor 工作;第三位联合创始人 Aiden Smith 是 Thiel Fellow,在脑科学和机器学习之间"超长通勤"了三年。

数据富人与数据穷人:AI 的经济分层

Ben 用简洁的框架揭示了当前 AI 能力的根本性不平等:

数据富有的领域:
- 搜索: 基本上整个互联网都是训练数据
- 编程: 互联网的很大一部分,而且编程环境非常友好——极其容易生成海量合成数据

这些任务加起来至少是一个万亿美元级别的市场——而 LLM 已经在这些任务上表现出色。

数据贫困的领域:
- 机器人: 需要大量工作来生成数据,远比编程和搜索复杂
- 金融交易: 只有有限的金融数据
- 科学发现: 显然数据极少——但潜在回报无限

"还有最重要的,"Ben 话锋一转,"端到端烤面包机供应链。 我提到这个不是因为烤面包机本身,而是因为它所代表的东西——有成千上万像这样的东西构成了广泛的经济体。广泛的经济并不只是搜索和编程,它包含了大量真正数据匮乏的领域。"

核心理念是:人类用少 1-10 万倍的数据量就能成为优秀的程序员——如果模型也能做到这一点,AI 经济的版图将彻底改变。

算力容易规模化,数据不是

Asher 补充了第二个论点:算力比数据更容易规模化。

"如果你想进入经济中收集长尾任务的数据,你必须应对监管、与公司谈判使用条款……实际上非常烦人。"

Asher 的结论直截了当:"如果你能让一个模型的数据效率提高一千倍,它的部署难度也会降低一千倍。"

数据的集中化:谁来参与 AI 革命?

第三个论点上升到哲学层面。Asher 观察到,今天能够训练 AI 模型的公司并不多——部分原因是算力集中化,但也因为数据的集中化。

他举例:Neo Labs 在创建新能力时,会"直接收购濒临倒闭的书店"来寻找所有可能的数据,去罕见的图书馆寻找训练前沿模型所需的小众数据。

"在今天的会议中,关于'AI 世界的护城河是什么'的投票——最常见的答案是数据。如果这是真的,那么数据效率就是真正实现更广泛竞争的东西。 如果你关心未来世界的形态,你应该关心数据效率,因为它调节着谁能够参与 AI 经济的哪些部分。"

从硬件原语出发:为什么 GPU 底层系统是关键

Flapping Airplanes 的技术路径不同寻常——他们不只是在现有框架上做算法优化,而是从最底层入手。

Ben 用一张示意图展示了一个核心洞察:GPU 硬件能高效执行的事情是一个大圆,而 PyTorch 等现有框架能高效表达的是其中的一个小圆。"在灰色的小圆里,我们已经看到了大量研究——我们知道哪些算法有效。但如果你在寻找全新的能力,你可能需要去那些未被探索的区域。这就是 Flapping Airplanes 的领域。"

历史站在他们这一边。Asher 指出,过去 15-20 年甚至 100 年的机器学习发展,很大程度上来自于发现新的与硬件交互的原语——不一定涉及设计新芯片(虽然那也很重要),而是"仅仅弄清楚如何从已经普及的现有技术中挤出更多。"

"榨干"GPU:框架革命

Ben 展示了团队内部的一个演示——一个在 PyTorch 中"渐近低效"(asymptotically inefficient)执行的工作负载。这是一个"极小批次、深度流水线、Hogwild 风格的训练循环"——在当前框架下极难实现,但在他们的自定义虚拟机中却可以高效运行。

"当你构建这些新型系统时,你就开启了新的算法可能性,"Ben 说,"其中许多算法我们相信与数据效率问题高度相关。"

他的热情溢于言表:"我真的很享受'虐待'GPU——以之前从未有过的方式。如果你喜欢玩硬件,我会推荐你来试试。"

结语:数据效率决定 AI 的未来形状

Flapping Airplanes 的命题切中了一个被算力军备竞赛叙事掩盖的关键问题:即使你有世界上所有的 GPU,如果没有正确的训练数据,你也无法构建一个能在广泛经济体中真实部署的 AI。 而当"数据是护城河"成为行业共识时,真正撬动这一护城河的杠杆不是更努力地收集数据——而是让每个数据点都发挥更大价值。

兄弟二人用一句简单的话总结了他们的使命:"如果你关心未来世界的形态,如果你关心 AI 在广泛经济体中的部署,你应该关心让模型变得更加数据高效。"

在一个对烘焙面包机供应链也需要 AI 全面渗透的未来,Flapping Airplanes 押注的,不是更大的数据——而是更聪明的数据。