OpenAI Sam Altman：打造你生活中的"核心 AI 订阅"

cover Sequoia Capital · 2025-05-12🎬 在 YouTube 观看原视频 →>

摘要

Sam Altman 在红杉资本 AI Ascent 2025 活动上回到九年前 OpenAI 的第一个办公室，回顾了从 2016 年 14 人的研究实验室到如今 ChatGPT 每周 5 亿用户的非凡旅程。他坦诚分享了 OpenAI 的产品哲学：不做宏大的逆向规划（Working Backwards），而是保持灵活、向前推进（Working Forwards），在不确定性中反复迭代。Altman 明确定义了 OpenAI 的终极野心——成为每个人生活中的"核心 AI 订阅"（Core AI Subscription）：一个统一的智能层，连接文件、记忆、上下文和跨服务能力。他同时预测了未来三年的关键节点：2025 年是智能体做事的年份，编程为主导类别；2026 年 AI 将辅助重大科学发现；2027 年机器人将从新奇事物走向真正的经济价值创造者。在对话的最后，Altman 罕见地分享了关于创始人韧性的深刻洞察：真正的困难不是危机爆发的当天，而是第 60 天你试图重建时的心理管理。

正文

回到起点：2016 年的研究实验室

"这是我们第一个办公室。"Altman 指着红杉资本的旧址说道。2016 年，OpenAI 只有 14 个人，围坐在一起盯着白板讨论该做什么。"我们是一个有着极强信念和方向感、但没有真正行动计划的研究实验室。不是公司，不是产品，那时甚至大语言模型（LLM）这个想法也还很遥远。"他们当时在做的事情是"尝试打电子游戏"——如今这一点已经做得相当出色。

从那个起点到第一个消费者产品，整整走了六年。但 Altman 纠正了一个普遍的误解：第一个消费者产品不是 ChatGPT，甚至也不是 API。第一个产品是 DALL-E。

GPT 的演化与 API 战略的诞生

OpenAI 的路线经历了多次转向。从尝试打游戏、做机械手，到最终有一小群人（最初是一个人，后来一个团队）对无监督学习（Unsupervised Learning）和语言模型产生了热情。GPT-1、GPT-2 相继问世。到 GPT-3 时，团队既觉得"这东西有点酷"，又完全不知道该拿它来做什么。

同时，一个现实问题摆在眼前：训练 GPT-4 需要数十亿美元级别的投入，"除非你是粒子加速器项目，否则没办法纯粹当作科学实验来做"。于是 OpenAI 开始思考如何让这件事成为一门可持续的生意。

Altman 从 Y Combinator 的经历中提炼出两个观察：一是如果你做一个 API，通常在某个方向上会奏效；二是如果你让某样东西变得更容易使用，通常会有巨大的回报。于是 2020 年 6 月，GPT-3 API 上线了。

"世界并不在意，但硅谷在意。"一小部分创始人惊呼"这就是通用人工智能（AGI）"。然而，真正能靠 GPT-3 API 建立业务的公司寥寥无几——文案写作服务几乎是唯一能跨越经济门槛的品类。

但有一件事引起了团队的注意：尽管 GPT-3 的聊天体验很糟糕（那时还没有 RLHF 技术），人们在 Playground 里就是喜欢和它聊天。"从某种意义上说，这是 API 产品除了文案写作之外唯一的杀手级用例，最终引导我们创建了 ChatGPT。"

2022 年 11 月 30 日，ChatGPT 上线。如今，每周有超过 5 亿人在使用它。

大公司如何保持产品速度？——让自己忙起来

当被问及 OpenAI 如何在规模扩张的同时加速产品发布节奏时，Altman 提出了一个反直觉的观点：很多公司的错误是规模变大后不做更多事情。 人越多，做的事还是那么多，结果就是 40 个人挤在每一个会议里，为产品的微小部分激烈争夺。

"我相信每个人都应该忙碌，团队应该小，你应该在人员数量相对有限的情况下做大量事情。"OpenAI 的做法是：让相对少的人承担巨大的责任。"研究者、工程师、产品人——他们驱动着几乎所有的价值，你要让这些人忙碌且高效。"

他补充道，OpenAI 确实有一个巨大的机会去构建下一代重要的互联网平台。要做到这一点——成为人们在多种服务中使用的个性化 AI——"有太多东西需要去构建了"。

核心 AI 订阅：OpenAI 的终极定位

当被问及在场的创业者应该如何避免成为 OpenAI 前进道路上的"牺牲品"时，Altman 给出了清晰的战略描述：OpenAI 的目标是成为人们生活中的"核心 AI 订阅"。

一部分体验将在 ChatGPT 内部完成，另一部分则通过几个关键的订阅服务来实现。但核心逻辑是：构建越来越聪明的模型，提供类似操作系统或未来设备的交互界面，然后开放平台让其他人基于此创造惊人的价值。

"我们还没有完全搞清楚 API 或 SDK 应该是什么样子才能真正成为我们的平台，但我们会做到的。可能需要几次尝试，但我们会的。我希望这能促成世界上难以置信的财富创造，让其他人能够在此基础上构建。"

工作向前，而非向后

Altman 坦承 OpenAI 并没有一个宏大的"主计划"："有很多聪明人在谈论他们如何制定绝妙的战略——这里是终点，他们要从终点往回推算，这是倒数第二步，这是倒数第三步……而我从未见过这些人取得巨大成功。"

OpenAI 的风格是：知道需要大量 AI 基础设施，知道需要持续让模型变得更好，知道需要构建出色的消费级产品——但具体明年会做什么产品，他们现在甚至还没开始想。"我们为自己的灵活性和根据世界变化调整策略的能力感到自豪。"

这种自信建立在研究路线的乐观之上。Altman 说："我对我们的研究路线图从未像现在这样乐观。"当被追问路线上有什么时，他只回答了三个字："特别聪明的模型。"

大公司为什么慢？——这不是新闻

"让我感到失望但并不意外。"Altman 如此评价大公司在 AI 转型中的迟缓表现。他认为这本质上是每一次重大技术革命中都会重复的故事：组织和人变得极度固守成规，每季度甚至每两年才重新评估一次决策——当你的信息安全委员会每年才开一次会来决定允许哪些应用、数据输入系统意味着什么时，"看这个过程真的很痛苦"。

他的预测是：大公司还会继续对抗一两年，假装 AI 不会重塑一切，然后经历一次投降式的最后冲刺——"但那时已经太晚了，初创公司会直接碾压那些用旧方式做事的人。"

Altman 还指出了一个代际鸿沟："一个普通 20 岁年轻人使用 ChatGPT 的方式，和一个 35 岁的人使用它的方式，差异令人难以置信。这让我想起智能手机刚出来的时候，小孩子秒上手，年长的人花了三年才学会基础操作。"

他的粗略概括是：年长的人用 ChatGPT 替代 Google，二三十岁的人把它当生活顾问，大学生则把它当操作系统（Operating System）。

语音、编程与未来设备的形态

语音被 Altman 定义为"极其重要"但"尚未做好"的领域。"就像文本模型也花了一段时间才做好一样，我们最终会攻破这个难题。当我们做到时，很多人会更多地使用语音交互。"

Altman 特别提到了一个尚未被充分探索的方向：语音加图形界面的混合交互。 "你可以一边说话，一边在手机上点来点去——我相信这其中有很了不起的事情可以做。"

至于编程，Altman 将其定位为"更核心的战略方向"。他的愿景是：未来的模型不仅返回文本或图像，而是返回整个程序——每一个回答都可以是定制渲染的代码。编程将是模型"驱动世界"的核心方式——调用 API、让事情在真实世界中发生。

个性化 AI 的柏拉图理想

当被问及定制化策略时，Altman 描绘了一个极致的愿景："柏拉图式的理想状态是一个拥有万亿 Token 上下文的微型推理模型，你把自己的一辈子放进去——每一次对话、每一本读过的书、每一封邮件、每一个看到的东西，加上来自其他来源的所有数据，你的生活就不断追加到上下文中。模型从不重新训练，权重从不定制，但它能在整个上下文中高效推理。"

他坦诚目前还无法实现这一点，"所以在抵达这个理想之前的一切都是妥协。"

未来三年：智能体 → 科学发现 → 机器人

Altman 给出了一个"随手一拍"的三年时间线：

2025 年：智能体（Agent）开始真正做事的年份。编程将是主导类别，还有其他几个领域。
2026 年：AI 开始发现新事物——可能辅助人类完成一些重大的科学突破。Altman 认为，人类历史上大多数可持续的经济增长来自于更好的科学知识。
2027 年：这一切从知识领域迁移到物理世界。机器人从新奇事物变成严肃的经济价值创造者。

创始人韧性：最难的是第 60 天

在结束对话前，Altman 被要求分享关于创始人韧性的建议。他的回答直击要害：

"随着时间推移会变得更容易。作为创始人，你会面对大量的逆境，挑战会越来越难、赌注越来越高——但情感上的代价确实会越来越小，因为你经历过的糟糕事情越来越多。从某种意义上说，你的抗压能力在每一次经历中都会增强。"

但他真正想强调的是：最难的不是危机爆发的那一刻。 当公司没钱的时候，很多人会来支持你，你靠肾上腺素就能撑过去。真正难以管理的是"危机过后的余波"——第 60 天，当你试图从废墟中重建时。

"人们大量讨论危机时刻如何应对，但很少有值得推荐给创始人的东西是关于——不是第 0 天、第 1 天、第 2 天如何面对真正的危机，而是第 60 天你如何收拾残局。这是你可以练习并变得更好的领域。"