OpenAI Sam Altman:打造你生活中的"核心 AI 订阅"

摘要
Sam Altman 在红杉资本 AI Ascent 2025 活动上回到九年前 OpenAI 的第一个办公室,回顾了从 2016 年 14 人的研究实验室到如今 ChatGPT 每周 5 亿用户的非凡旅程。他坦诚分享了 OpenAI 的产品哲学:不做宏大的逆向规划(Working Backwards),而是保持灵活、向前推进(Working Forwards),在不确定性中反复迭代。Altman 明确定义了 OpenAI 的终极野心——成为每个人生活中的"核心 AI 订阅"(Core AI Subscription):一个统一的智能层,连接文件、记忆、上下文和跨服务能力。他同时预测了未来三年的关键节点:2025 年是智能体做事的年份,编程为主导类别;2026 年 AI 将辅助重大科学发现;2027 年机器人将从新奇事物走向真正的经济价值创造者。在对话的最后,Altman 罕见地分享了关于创始人韧性的深刻洞察:真正的困难不是危机爆发的当天,而是第 60 天你试图重建时的心理管理。
正文
回到起点:2016 年的研究实验室
"这是我们第一个办公室。"Altman 指着红杉资本的旧址说道。2016 年,OpenAI 只有 14 个人,围坐在一起盯着白板讨论该做什么。"我们是一个有着极强信念和方向感、但没有真正行动计划的研究实验室。不是公司,不是产品,那时甚至大语言模型(LLM)这个想法也还很遥远。"他们当时在做的事情是"尝试打电子游戏"——如今这一点已经做得相当出色。
从那个起点到第一个消费者产品,整整走了六年。但 Altman 纠正了一个普遍的误解:第一个消费者产品不是 ChatGPT,甚至也不是 API。第一个产品是 DALL-E。
GPT 的演化与 API 战略的诞生
OpenAI 的路线经历了多次转向。从尝试打游戏、做机械手,到最终有一小群人(最初是一个人,后来一个团队)对无监督学习(Unsupervised Learning)和语言模型产生了热情。GPT-1、GPT-2 相继问世。到 GPT-3 时,团队既觉得"这东西有点酷",又完全不知道该拿它来做什么。
同时,一个现实问题摆在眼前:训练 GPT-4 需要数十亿美元级别的投入,"除非你是粒子加速器项目,否则没办法纯粹当作科学实验来做"。于是 OpenAI 开始思考如何让这件事成为一门可持续的生意。
Altman 从 Y Combinator 的经历中提炼出两个观察:一是如果你做一个 API,通常在某个方向上会奏效;二是如果你让某样东西变得更容易使用,通常会有巨大的回报。于是 2020 年 6 月,GPT-3 API 上线了。
"世界并不在意,但硅谷在意。"一小部分创始人惊呼"这就是通用人工智能(AGI)"。然而,真正能靠 GPT-3 API 建立业务的公司寥寥无几——文案写作服务几乎是唯一能跨越经济门槛的品类。
但有一件事引起了团队的注意:尽管 GPT-3 的聊天体验很糟糕(那时还没有 RLHF 技术),人们在 Playground 里就是喜欢和它聊天。"从某种意义上说,这是 API 产品除了文案写作之外唯一的杀手级用例,最终引导我们创建了 ChatGPT。"
2022 年 11 月 30 日,ChatGPT 上线。如今,每周有超过 5 亿人在使用它。
大公司如何保持产品速度?——让自己忙起来
当被问及 OpenAI 如何在规模扩张的同时加速产品发布节奏时,Altman 提出了一个反直觉的观点:很多公司的错误是规模变大后不做更多事情。 人越多,做的事还是那么多,结果就是 40 个人挤在每一个会议里,为产品的微小部分激烈争夺。
"我相信每个人都应该忙碌,团队应该小,你应该在人员数量相对有限的情况下做大量事情。"OpenAI 的做法是:让相对少的人承担巨大的责任。"研究者、工程师、产品人——他们驱动着几乎所有的价值,你要让这些人忙碌且高效。"
他补充道,OpenAI 确实有一个巨大的机会去构建下一代重要的互联网平台。要做到这一点——成为人们在多种服务中使用的个性化 AI——"有太多东西需要去构建了"。
核心 AI 订阅:OpenAI 的终极定位
当被问及在场的创业者应该如何避免成为 OpenAI 前进道路上的"牺牲品"时,Altman 给出了清晰的战略描述:OpenAI 的目标是成为人们生活中的"核心 AI 订阅"。
一部分体验将在 ChatGPT 内部完成,另一部分则通过几个关键的订阅服务来实现。但核心逻辑是:构建越来越聪明的模型,提供类似操作系统或未来设备的交互界面,然后开放平台让其他人基于此创造惊人的价值。
"我们还没有完全搞清楚 API 或 SDK 应该是什么样子才能真正成为我们的平台,但我们会做到的。可能需要几次尝试,但我们会的。我希望这能促成世界上难以置信的财富创造,让其他人能够在此基础上构建。"
工作向前,而非向后
Altman 坦承 OpenAI 并没有一个宏大的"主计划":"有很多聪明人在谈论他们如何制定绝妙的战略——这里是终点,他们要从终点往回推算,这是倒数第二步,这是倒数第三步……而我从未见过这些人取得巨大成功。"
OpenAI 的风格是:知道需要大量 AI 基础设施,知道需要持续让模型变得更好,知道需要构建出色的消费级产品——但具体明年会做什么产品,他们现在甚至还没开始想。"我们为自己的灵活性和根据世界变化调整策略的能力感到自豪。"
这种自信建立在研究路线的乐观之上。Altman 说:"我对我们的研究路线图从未像现在这样乐观。"当被追问路线上有什么时,他只回答了三个字:"特别聪明的模型。"
大公司为什么慢?——这不是新闻
"让我感到失望但并不意外。"Altman 如此评价大公司在 AI 转型中的迟缓表现。他认为这本质上是每一次重大技术革命中都会重复的故事:组织和人变得极度固守成规,每季度甚至每两年才重新评估一次决策——当你的信息安全委员会每年才开一次会来决定允许哪些应用、数据输入系统意味着什么时,"看这个过程真的很痛苦"。
他的预测是:大公司还会继续对抗一两年,假装 AI 不会重塑一切,然后经历一次投降式的最后冲刺——"但那时已经太晚了,初创公司会直接碾压那些用旧方式做事的人。"
Altman 还指出了一个代际鸿沟:"一个普通 20 岁年轻人使用 ChatGPT 的方式,和一个 35 岁的人使用它的方式,差异令人难以置信。这让我想起智能手机刚出来的时候,小孩子秒上手,年长的人花了三年才学会基础操作。"
他的粗略概括是:年长的人用 ChatGPT 替代 Google,二三十岁的人把它当生活顾问,大学生则把它当操作系统(Operating System)。
语音、编程与未来设备的形态
语音被 Altman 定义为"极其重要"但"尚未做好"的领域。"就像文本模型也花了一段时间才做好一样,我们最终会攻破这个难题。当我们做到时,很多人会更多地使用语音交互。"
Altman 特别提到了一个尚未被充分探索的方向:语音加图形界面的混合交互。 "你可以一边说话,一边在手机上点来点去——我相信这其中有很了不起的事情可以做。"
至于编程,Altman 将其定位为"更核心的战略方向"。他的愿景是:未来的模型不仅返回文本或图像,而是返回整个程序——每一个回答都可以是定制渲染的代码。编程将是模型"驱动世界"的核心方式——调用 API、让事情在真实世界中发生。
个性化 AI 的柏拉图理想
当被问及定制化策略时,Altman 描绘了一个极致的愿景:"柏拉图式的理想状态是一个拥有万亿 Token 上下文的微型推理模型,你把自己的一辈子放进去——每一次对话、每一本读过的书、每一封邮件、每一个看到的东西,加上来自其他来源的所有数据,你的生活就不断追加到上下文中。模型从不重新训练,权重从不定制,但它能在整个上下文中高效推理。"
他坦诚目前还无法实现这一点,"所以在抵达这个理想之前的一切都是妥协。"
未来三年:智能体 → 科学发现 → 机器人
Altman 给出了一个"随手一拍"的三年时间线:
- 2025 年:智能体(Agent)开始真正做事的年份。编程将是主导类别,还有其他几个领域。
- 2026 年:AI 开始发现新事物——可能辅助人类完成一些重大的科学突破。Altman 认为,人类历史上大多数可持续的经济增长来自于更好的科学知识。
- 2027 年:这一切从知识领域迁移到物理世界。机器人从新奇事物变成严肃的经济价值创造者。
创始人韧性:最难的是第 60 天
在结束对话前,Altman 被要求分享关于创始人韧性的建议。他的回答直击要害:
"随着时间推移会变得更容易。作为创始人,你会面对大量的逆境,挑战会越来越难、赌注越来越高——但情感上的代价确实会越来越小,因为你经历过的糟糕事情越来越多。从某种意义上说,你的抗压能力在每一次经历中都会增强。"
但他真正想强调的是:最难的不是危机爆发的那一刻。 当公司没钱的时候,很多人会来支持你,你靠肾上腺素就能撑过去。真正难以管理的是"危机过后的余波"——第 60 天,当你试图从废墟中重建时。
"人们大量讨论危机时刻如何应对,但很少有值得推荐给创始人的东西是关于——不是第 0 天、第 1 天、第 2 天如何面对真正的危机,而是第 60 天你如何收拾残局。这是你可以练习并变得更好的领域。"