为什么数据才是真正的 AI 瓶颈：Flapping Airplanes 的 Ben 和 Asher Spector

cover Sequoia Capital · 2026-05-06🎬 在 YouTube 观看原视频 →>

摘要

Ben Spector 和 Asher Spector 是一对兄弟——都是斯坦福博士——他们联合创立的 Flapping Airplanes 提出了一个在算力军备竞赛声浪中被忽视的关键命题：数据效率（Data Efficiency）才是 AI 真正的瓶颈。 在 Sequoia AI Ascent 2026 上，兄弟俩从三个维度论证了这一观点：(1) 经济维度——当前 LLM 在搜索和编程上表现出色，因为这些任务拥有整个互联网级别的"富数据"资源，但更广泛的经济体——机器人、金融交易、科学发现——数据极其稀缺，而正是这些领域代表着数万亿的市场机会；(2) 规模维度——算力（FLOPS）以指数级速度变得更便宜，而高质量数据的收集面临监管、谈判、隐私等结构性障碍，远不如算力同质化和可规模化；(3) 哲学维度——数据是 AI 世界的护城河（会议现场投票显示此为共识），数据效率是实现更广泛竞争、让更多公司参与 AI 革命的关键。他们的技术路径是从底层硬件原语（Hardware Primitives）出发——超越 PyTorch 等现有框架的表达限制，直接"榨干"GPU 的能力，通过细粒度并行和全新算法设计来大幅提升数据效率。正如 Ben 所说："我们试图用以前从未有过的方式'虐待'GPU。"

正文

"我们不是航空公司"：一对兄弟的澄清

Flapping Airplanes 的名字一开始就制造了一个意外的笑点。公司三个月前宣布成立后，收到了大量来自航空业的联系——"人们试图卖给我们跑道、飞机零件、风洞……不是风险投资意义上的 runway，是字面意义上的跑道。"

Asher 不得不在演讲开头郑重澄清："我们不是一家航空公司，我们是一个 AI 实验室。"

澄清归澄清，但 Ben 和 Asher 的背景远非玩票：Ben 在斯坦福花了三年时间"深陷内核矿井"，编写极低层次的 GPU 系统代码；Asher 同样是斯坦福博士，曾在 Cursor 和 Mercor 工作；第三位联合创始人 Aiden Smith 是 Thiel Fellow，在脑科学和机器学习之间"超长通勤"了三年。

数据富人与数据穷人：AI 的经济分层

Ben 用简洁的框架揭示了当前 AI 能力的根本性不平等：

数据富有的领域：
- 搜索： 基本上整个互联网都是训练数据
- 编程： 互联网的很大一部分，而且编程环境非常友好——极其容易生成海量合成数据

这些任务加起来至少是一个万亿美元级别的市场——而 LLM 已经在这些任务上表现出色。

数据贫困的领域：
- 机器人： 需要大量工作来生成数据，远比编程和搜索复杂
- 金融交易： 只有有限的金融数据
- 科学发现： 显然数据极少——但潜在回报无限

"还有最重要的，"Ben 话锋一转，"端到端烤面包机供应链。 我提到这个不是因为烤面包机本身，而是因为它所代表的东西——有成千上万像这样的东西构成了广泛的经济体。广泛的经济并不只是搜索和编程，它包含了大量真正数据匮乏的领域。"

核心理念是：人类用少 1-10 万倍的数据量就能成为优秀的程序员——如果模型也能做到这一点，AI 经济的版图将彻底改变。

算力容易规模化，数据不是

Asher 补充了第二个论点：算力比数据更容易规模化。

FLOPS 以指数级速度变得更便宜
算力市场相对同质化——GPT 发布后，你只需要尽可能多地购买算力
而数据完全不同：没有中心化的数据提供商

"如果你想进入经济中收集长尾任务的数据，你必须应对监管、与公司谈判使用条款……实际上非常烦人。"

Asher 的结论直截了当："如果你能让一个模型的数据效率提高一千倍，它的部署难度也会降低一千倍。"

数据的集中化：谁来参与 AI 革命？

第三个论点上升到哲学层面。Asher 观察到，今天能够训练 AI 模型的公司并不多——部分原因是算力集中化，但也因为数据的集中化。

他举例：Neo Labs 在创建新能力时，会"直接收购濒临倒闭的书店"来寻找所有可能的数据，去罕见的图书馆寻找训练前沿模型所需的小众数据。

"在今天的会议中，关于'AI 世界的护城河是什么'的投票——最常见的答案是数据。如果这是真的，那么数据效率就是真正实现更广泛竞争的东西。 如果你关心未来世界的形态，你应该关心数据效率，因为它调节着谁能够参与 AI 经济的哪些部分。"

从硬件原语出发：为什么 GPU 底层系统是关键

Flapping Airplanes 的技术路径不同寻常——他们不只是在现有框架上做算法优化，而是从最底层入手。

Ben 用一张示意图展示了一个核心洞察：GPU 硬件能高效执行的事情是一个大圆，而 PyTorch 等现有框架能高效表达的是其中的一个小圆。"在灰色的小圆里，我们已经看到了大量研究——我们知道哪些算法有效。但如果你在寻找全新的能力，你可能需要去那些未被探索的区域。这就是 Flapping Airplanes 的领域。"

历史站在他们这一边。Asher 指出，过去 15-20 年甚至 100 年的机器学习发展，很大程度上来自于发现新的与硬件交互的原语——不一定涉及设计新芯片（虽然那也很重要），而是"仅仅弄清楚如何从已经普及的现有技术中挤出更多。"

"榨干"GPU：框架革命

Ben 展示了团队内部的一个演示——一个在 PyTorch 中"渐近低效"（asymptotically inefficient）执行的工作负载。这是一个"极小批次、深度流水线、Hogwild 风格的训练循环"——在当前框架下极难实现，但在他们的自定义虚拟机中却可以高效运行。

"当你构建这些新型系统时，你就开启了新的算法可能性，"Ben 说，"其中许多算法我们相信与数据效率问题高度相关。"

他的热情溢于言表："我真的很享受'虐待'GPU——以之前从未有过的方式。如果你喜欢玩硬件，我会推荐你来试试。"

结语：数据效率决定 AI 的未来形状

Flapping Airplanes 的命题切中了一个被算力军备竞赛叙事掩盖的关键问题：即使你有世界上所有的 GPU，如果没有正确的训练数据，你也无法构建一个能在广泛经济体中真实部署的 AI。 而当"数据是护城河"成为行业共识时，真正撬动这一护城河的杠杆不是更努力地收集数据——而是让每个数据点都发挥更大价值。

兄弟二人用一句简单的话总结了他们的使命："如果你关心未来世界的形态，如果你关心 AI 在广泛经济体中的部署，你应该关心让模型变得更加数据高效。"

在一个对烘焙面包机供应链也需要 AI 全面渗透的未来，Flapping Airplanes 押注的，不是更大的数据——而是更聪明的数据。