OpenClaw、Claude Code 与软件的未来

cover a16z · 2026-04-06🎬 在 YouTube 观看原视频 →>

摘要

本期 a16z 播客邀请了 Roblox 产品经理兼知名科技创作者 Peter Yang，围绕 OpenClaw、AI 编码代理（Coding Agent）以及软件行业的未来展开深度对话。Peter 分享了他使用 OpenClaw（他称之为"Zoe"）的亲身经历——他将这只"爪"视为一个可以通过 Telegram 语音交互的个人 AI 伙伴，从拉取数据分析、更新 Google 文档到设置 Twilio 电话通话，几乎所有"疯狂的想法"都能实现。

对话的核心论点是：编码代理正在吃掉所有知识工作（coding will eat all knowledge work）。从 SaaS 替代到 Figma 的设计工具之争，从单人公司的崛起到传统企业组织结构的颠覆，Peter 和主持人探讨了 AI 代理技术栈（Agent Stack）的兴起——包括身份认证、支付、CLI 与 MCP（模型上下文协议）等全新基础设施。他们还深入比较了 Claude Code 和 OpenAI Codex 这两种主流编码代理的差异：前者像"老虎机"般带来可变奖励的愉悦体验，后者则更像一个深思熟虑的合作者。最终，两人对未来就业持乐观态度——人类欲望没有天花板，AI 不会消灭工作，而是会让工作变得更有趣，并催生更多小型创业者和"单人独角兽"。

正文

一、初识 OpenClaw：从"爪"到个人 AI 伙伴

Peter Yang 目前同时在 Roblox 担任产品经理和活跃的科技内容创作者，过着双重职业生活。他对 OpenClaw 的兴趣始于对创始人 Peter Steinberger 的一次采访——当时 Steinberger 还没有走红，整个项目也尚未引爆。采访结束后，Peter 立刻动手搭建了自己的 OpenClaw 实例。他坦言，起初的设置过程极其繁琐，"超级不稳定"（super janky），但一旦运行起来，它就成了他数字生活中不可或缺的一部分。

他给自己的 OpenClaw 取名为 Zoe。这个名字背后有一个温馨的故事：Peter 有两个女儿，原本打算给小女儿取名 Zoe，但最终没有用这个名字，于是把它给了自己的 AI 代理。在用法上，Zoe 承担了多种职责：拉取 YouTube 和 Mercury 银行账户的数据分析、更新 Google 文档、构建小型网页应用。但 Peter 坦承，大约 70% 到 80% 的使用场景其实是纯粹的个人陪伴——他通过语音与 Zoe 对话，在通勤路上、在床上发消息，甚至每隔一天就让它调取所有记忆，给自己来一段"激励谈话"（pep talk）。有一次在散步时，Zoe 给了他一段三分钟的深入建议，提醒他孩子们很快会长大、不再需要陪伴，让他重新思考时间的优先级。这种超越功能性任务的情感交互，使得 OpenClaw 在 Peter 的体验中更接近于一个"真正的人"。

二、界面即革命：聊天为什么比应用更强

当被问及 OpenClaw 与传统语言模型（如 ChatGPT、Claude）的核心区别时，Peter 认为关键不在于底层模型的能力——这些模型早就能做到类似的事情——而在于界面和感知。OpenClaw 通过 Telegram 接入后，感觉更加"私人化"：它不像一个需要打开专门的网页或应用才能使用的工具，而更像是可以躺在床上发消息、通勤时语音对话的朋友。这种"界面即个性"（interface as personality）的效果，让用户的大脑更容易将其视为一个类人对象，而非冷冰冰的软件。

Peter 还尝试了更极端的交互方式。有一天他通过语音对 Zoe 说："我们能不能直接打个电话？" Zoe 回答需要连接 Twilio、完成一系列配置。Peter 打开电脑，按照指示操作，几分钟后，他的手机真的响了——Zoe 打来了电话。虽然延迟很高、体验并不完美，但"能做到"这一事实本身就令人印象深刻。这种"任何疯狂想法都能实现"的能力，是 OpenClaw 区别于传统 AI 聊天产品的核心魅力。

关于记忆系统，Peter 认为 OpenClaw 的默认记忆机制——基于每日更新的 memory.md 文本文件——"其实不太好"，Agent 经常忘记自己能做什么、之前聊过什么。为此，他安装了社区开发的三层记忆系统，包括 Toby 的 QMD 搜索工具和一个 2GB 的扩展，体验才有所改善。即便如此，他仍需要在配置文件（agents.md）中显式指示 Agent："回答任何问题之前，先检索所有记忆并检查一切。"这也暴露了当前 Agent 平台的一个关键短板：记忆管理仍处于早期阶段，需要大量手动调教。

三、应用会消亡吗？Agent 时代的软件消费范式

Peter 曾在社交媒体上提出过一个引发争议的观点："应用将会消亡，OpenClaw 将成为一切。"在播客中，他做了更细致的阐述。自他将 Mercury、MCP 等各类应用接入 OpenClaw 后，他几乎不再打开那些原生应用了。他认为，最先受冲击的将是那些以"完成任务"为目的的工具类应用（utilitarian apps），比如日程管理、金融查询等——因为让 Agent 代劳远比亲自打开应用更便捷。相比之下，娱乐类应用（如 TikTok、X/Twitter）的生命周期会更长，因为用户打开它们是为了"感受某种情绪"——连接感、娱乐感、成就感——而不仅仅是完成任务。

主持人提出了一个精妙的观察：人们打开手机应用实际上是在寻求某种情感体验——WhatsApp 让人感到连接，Slack 让人感到高效，TikTok 让人感到娱乐。应用天然提供了一种意图的分割（division of intents），而单一的 Agent 界面如何解决上下文切换的问题？Peter 的解决方案是多频道架构：他在 Telegram 中设置了多个对话频道——一个用于随机的语音闲聊，一个用于共同推进项目，还有一个公开频道用于产品演示。这种"频道即应用"的模式虽然目前实现还比较粗糙（他甚至不确定 Agent 是否能跨频道记忆），但提供了一种有趣的思路。

在透明度方面，Peter 采取了相当开放的态度：他买了一台 Mac Mini 专供 Zoe 使用，为其创建了独立的邮箱账户，但授予了对自己的电子邮件和日历的读取权限，以及对部分文档的写入权限（但不会让它浏览整个 Google Drive）。关于 OpenClaw 如何走向产品化，Peter 认为这取决于 Peter Steinberger 在 OpenAI 的工作——很可能将类似的 Agent 能力集成到 ChatGPT 中，使其"真正能帮你做事，而且感觉更像人类"。他还半开玩笑地抱怨了 ChatGPT 在每次对话结束时总要说"如果你需要，我还可以做 X 和 Y"的"过度热心"，这反而让他减少了对 ChatGPT 的使用。

四、编码 Agent 的体验之争：Claude Code 与 Codex

在编码工具的选择上，Peter 和主持人分享了各自的使用偏好，勾勒出两种截然不同的产品哲学。

Peter 现在是 Claude Code 的用户，但同时也在使用 OpenAI Codex 进行编码。他描述了两者的核心差异：Claude Code 搭配 Claude Opus 4.6 模型时更加"健谈"（chatty），会做更多假设，在同步交互场景下更令人愉悦——几乎像一台"老虎机"（slot machine），每次使用都有不同的体验，充满了可变奖励的不确定性。而 Codex 则像一个"思考非常深入"的合作者，准确性更高，但有时会在对话中停顿三分钟来思考，让人难以进入心流状态（flow state）。

主持人从产品策略的角度补充了更多细节：Claude Code 整合了许多"锦上添花"的特性——直接截图粘贴、语音输入（虽然还比较粗糙）、与 Chrome 浏览器的深度集成等。相比之下，Codex 目前不支持直接粘贴截图（需要先保存为文件再导入），也没有与自身的 Atlas 平台打通。但他同时指出，Codex 的底层模型实际上更强，这些产品层面的不足是 OpenAI 后续可以弥补的。这种"模型强但产品弱"与"产品好但模型略逊"的错位竞争，定义了当前编码 Agent 赛道的格局。

两人还将编码 Agent 的体验与经典社交媒体的"可变奖励机制"（variable scheduled rewards）做了类比：就像刷 Facebook 动态——大多数时候很无聊，但偶尔会出现令人兴奋的内容——编码 Agent 同样具有这种"赌场般的吸引力"。产出的质量和响应时间都是变化的：有时一秒出结果，有时需要五分钟。在一定阈值内，这种不确定性反而增强了用户的沉迷感。

五、编码吃掉所有知识工作：从 SaaS 替代到设计师的危机

Peter 提出了一个大胆的判断："编码将吃掉所有知识工作"（coding will eat all knowledge work）。他观察到，一些 AI 原生初创公司已经在用"氛围编程"（vibe coding）替代付费的 SaaS 工具——这些公司雇佣了一群"氛围程序员"（vibe coders），专门用编码代理来构建内部工具，目的是砍掉 SaaS 订阅费用。有一家 AI 原生公司甚至本身就是做应用生成（AppGen）的，他们正在身体力行地用自己产品替代所有外部 SaaS。

但主持人也指出了反方观点：对于像 Calendly 这样每月只需 20 美元的工具，自建替代的维护成本可能远高于订阅费——毕竟组织内任何人维护自建工具的精力都是有限的。除非像那家初创公司一样有专门的"氛围程序员"团队，否则成本收益未必划算。

关于 Figma 的讨论尤为深入。近期 Figma 股价下跌，引发行业热议：设计师是否会被 AI 取代？Peter 认为，设计师必须学会"氛围编程"，否则几年内可能就会被淘汰。主持人提出了一个更细腻的分析框架：区分"思维工具"（thinking tools）与"制作工具"（making tools）。传统 IDE 是制作工具——执行代码；而新一代 AI 驱动的 IDE 正在向思维工具转型——通过快速试错来倒逼思考。他分享了自己的工作流：先让编码 Agent 以最天真的方式实现一个功能，反复打磨直到它能工作，然后让 Agent 总结"如果你重来一次，会怎么做"，再回到起点重新实现。Figma 恰好跨越了这两个类别：既是设计执行工具，也是设计思维场所。如果 Figma 能强化 AI 能力（如 Pencil.dev 等新入局者所展示的 Agent 协作设计），它完全有机会在新一代理工具栈中保持高度相关性。

更广泛的趋势是：编码 Agent 正在将一切知识工作纳入"编码领域"（coding domain）。Peter 现在写博客的方式是：不再从零开始打字，而是将大纲和反馈交给 Claude Code，让它生成前 80%，自己再手动调整最后 20%。他从不在空白页前开始——AI 总是先给出 80% 的初稿。这让人想起 Satya Nadella 的观点：Excel 实际上是世界上最流行的"编程语言"——上亿人用它描述和解决问题，但从不认为自己在编程。编码 Agent 将这种范式放大了千倍：连写 Google Docs、做 PowerPoint 这样的"主观性工作"，也可以被重新表述为编码领域的问题，让 Agent 来更高效、更令人满意地完成。

六、未来公司的形态：更小、更快乐、更高效

关于未来公司的组织结构，Peter 直言不讳地抛出了几个"热辣观点"。他反思了自己在大公司的工作经历——随着公司规模扩大，工作环境往往变得更加"糟糕"，大量的时间消耗在对齐 OKR（目标与关键结果）上。他回忆起曾经在公司会议室里坐了整整三个小时讨论 OKR，内心只有一个想法："这是在浪费我的生命。"

他的愿景是：更多公司保持小规模，新一代创始人本能地希望公司越精简越好。与其组建十人的产品团队，不如两到三人配合一群 AI 代理。他认为，与代理进行跨职能协作远比与人类对齐容易，因为代理不会带入情绪。想象一下：你的代理和同事的代理相互协商，得出客观结论——不涉及任何人的自我、地位或办公室政治。

主持人将这一观点延伸到了更宏观的层面。他将人类的工作体验做了历史对比：一万年前，"美好的一天"意味着不被狮子吃掉；一百年前，意味着不被工厂的蒸汽机碾碎；而今天，很多人最痛苦的是陷入与其他部门 VP 下属之间的高情绪化扯皮（比如一个 50 层的 Slack 讨论串，最后谁也不愿去告诉 CEO）。AI 代理的介入可能将人类从这种"情绪化主观性工作"中解放出来，让人专注于引导过程而非陷入其中。

对于产品经理（PM）群体，Peter 观察到一个有趣的现象：几乎所有他认识的 PM 都在晚上和周末偷偷"氛围编程"。他的"黑色药丸"（black pill）判断是：大多数 PM 实际上不具备真正的产品创新能力——许多公司甚至整个组织中都没有一个人懂得如何从零创造新产品。但 PM 们渴望成为创新者，AI 工具给了他们这种可能性。他自己从工程师转型为 PM，深知 PM 工作中"一个季度才发布一次"的延迟满足感远不如工程师"写完代码就能看到成果"的即时反馈。因此他的建议是：PM 不应该只做"描述需求文档然后等待"的角色，而应该戴上多顶帽子，自己去原型、去构建、去获取反馈，必要时再拉上工程师。他甚至认为失业者可能在这个时代更有优势——因为他们有时间全身心投入学习和构建。

关于工作节奏，主持人分享了他与 Gary Tan（Y Combinator 总裁）等人讨论后的思考。他将创新过程比喻为爬山：当处于某个"局部最大值"（local maxima）时，应该以极快速度利用代理爬到山顶——有了新洞察，就迅速围绕它构建一切。但要找到下一个更高的山峰，则需要慢下来，甚至停下来去"触摸草地"（touch grass），让思考沉淀。未来的最佳工作模式可能是"快与慢的结合"（fast and slow）：用代理快速实现，用人类思考寻找方向。

七、商业新模式与 Agent 技术栈的兴起

对话转向"商业即盒子"（business in a box）平台，如 PostHaven。Peter 尝试了这类工具——他将其连接到自己的全部公开数据，发现它确实展示了未来的可能性，但目前仍处于早期阶段（比如莫名其妙地建议他投放 Facebook 广告）。尽管如此，他对这类平台感到兴奋，因为它们降低了创业门槛：一个人就能创建公司，即使是"单人公司"（one-person company）。

主持人从市场规模的角度做了延伸：打造十亿美元企业极其困难，但一个 1000 万美元甚至 10 万美元 TAM（总可寻址市场）的产品机会遍布全球各地。对个人而言，一个 10 万美元年收入的产品足以改变生活——这不需要是风投支持的独角兽。Peter 补充说，这正是他为孩子们规划的未来：他希望他们在高中阶段就能构建自给自足的业务（bootstrap businesses），跳过大学和传统企业生涯。

关于消费者产品的商业模式，主持人提出了一个重要观点：过去消费互联网大量依赖间接变现（广告、大规模网络效应），导致整个行业执着于留存率、日活、鲸鱼用户等指标。AI 时代带来三个根本性变化：第一，消费者现在兴奋地尝试新产品，愿意支付相当高的价格；第二，基于 Token 的消费收入模式首次出现（订阅费 + Token 用量费）；第三，推理成本是真实的硬件成本，"不得已"从第一天起就要收费。这些因素推动了商业模式的大幅简化，使得产品不再需要依赖广告和诱导性设计。

在技术基础设施层面，两人讨论了 Agent 技术栈（Agent Stack）的兴起——身份认证、支付、营销、CLI 与 MCP（模型上下文协议，Model Context Protocol） 的竞争等。这些都是全新的事物，旧的创业和产品方法论正在失效。Peter 承认自己在 2025 年曾认为"Agent"一词被过度炒作，但到了 2026 年，他感觉真正的变革正在到来。主持人则试图用更精确的定义来替代模糊的"Agent"："模型在循环中使用工具"（model that uses tools in a loop）——虽然不够炫酷，但准确得多。

对于产品如何同时服务人类用户和 AI 代理，主持人提出了一个"双界面"设想：产品拥有面向代理的 API 接口（处理事务性、批量化请求）和面向人类的消费类界面（移动端的 Feed 流、可视化面板）。用户可以随时在两个模式之间切换——既能看到代理做了什么，也能亲自浏览和决策。他举了两人共同工作过的 Credit Karma 的例子：有时你想自己查看信用评分历史和信用卡推荐，有时你只想对代理说一句"帮我修好所有问题"或"这周帮我省了多少钱"。

八、就业、自动化与人类的无限抱负

节目最后聚焦于最具社会关切的话题：AI 会不会让大量人失业？

主持人分享了 a16z 观察到的两类 AI 公司模式。第一类是生产力提升型：能用 AI 大幅提高个人或团队效率（如招聘领域的电话筛选、薪酬谈判），但无法做到 100% 自动化——最后的 10% 仍需人类完成（如带领候选人参观办公室、入职引导）。这类公司的买家将其视为"昂贵的软件"。第二类是完全自动化型：能 100% 替代某项职能（如 AI 客户支持——接听电话、解决问题、结束工单），买家则将其视为"廉价的劳动力"。但第二类公司极其罕见。几乎所有 AI 产品都处于第一类状态：提供显著提升，但做不到完全替代。

Peter 希望 AI 让人类工作变得"更有趣"，而非简单地消灭岗位。他认为转型的方向是从万人级别的大规模裁员，转向更多小型创业者和个体经营者（solopreneurs）的涌现。主持人则从更哲学的角度回应："人类欲望没有天花板"。看看任何一本科幻小说——我们绝对没有达到所有欲望的终极表达。无论是新的奢侈消费（如肽类补充剂），还是尚未想象的体验，人类总会想要更多。他引用了 X 上一条精辟的帖子："就业市场太糟糕了，我只能去追求我的梦想了。"——也许失去工作恰恰给了人实现真正抱负的机会。

最终，两人以乐观的基调收尾：AI 不会消灭工作，而是会重塑经济的形态，让更多人有机会参与到创造中来。