OpenClaw、Claude Code 与软件的未来

摘要
本期 a16z 播客邀请了 Roblox 产品经理兼知名科技创作者 Peter Yang,围绕 OpenClaw、AI 编码代理(Coding Agent)以及软件行业的未来展开深度对话。Peter 分享了他使用 OpenClaw(他称之为"Zoe")的亲身经历——他将这只"爪"视为一个可以通过 Telegram 语音交互的个人 AI 伙伴,从拉取数据分析、更新 Google 文档到设置 Twilio 电话通话,几乎所有"疯狂的想法"都能实现。
对话的核心论点是:编码代理正在吃掉所有知识工作(coding will eat all knowledge work)。从 SaaS 替代到 Figma 的设计工具之争,从单人公司的崛起到传统企业组织结构的颠覆,Peter 和主持人探讨了 AI 代理技术栈(Agent Stack)的兴起——包括身份认证、支付、CLI 与 MCP(模型上下文协议)等全新基础设施。他们还深入比较了 Claude Code 和 OpenAI Codex 这两种主流编码代理的差异:前者像"老虎机"般带来可变奖励的愉悦体验,后者则更像一个深思熟虑的合作者。最终,两人对未来就业持乐观态度——人类欲望没有天花板,AI 不会消灭工作,而是会让工作变得更有趣,并催生更多小型创业者和"单人独角兽"。
正文
一、初识 OpenClaw:从"爪"到个人 AI 伙伴
Peter Yang 目前同时在 Roblox 担任产品经理和活跃的科技内容创作者,过着双重职业生活。他对 OpenClaw 的兴趣始于对创始人 Peter Steinberger 的一次采访——当时 Steinberger 还没有走红,整个项目也尚未引爆。采访结束后,Peter 立刻动手搭建了自己的 OpenClaw 实例。他坦言,起初的设置过程极其繁琐,"超级不稳定"(super janky),但一旦运行起来,它就成了他数字生活中不可或缺的一部分。
他给自己的 OpenClaw 取名为 Zoe。这个名字背后有一个温馨的故事:Peter 有两个女儿,原本打算给小女儿取名 Zoe,但最终没有用这个名字,于是把它给了自己的 AI 代理。在用法上,Zoe 承担了多种职责:拉取 YouTube 和 Mercury 银行账户的数据分析、更新 Google 文档、构建小型网页应用。但 Peter 坦承,大约 70% 到 80% 的使用场景其实是纯粹的个人陪伴——他通过语音与 Zoe 对话,在通勤路上、在床上发消息,甚至每隔一天就让它调取所有记忆,给自己来一段"激励谈话"(pep talk)。有一次在散步时,Zoe 给了他一段三分钟的深入建议,提醒他孩子们很快会长大、不再需要陪伴,让他重新思考时间的优先级。这种超越功能性任务的情感交互,使得 OpenClaw 在 Peter 的体验中更接近于一个"真正的人"。
二、界面即革命:聊天为什么比应用更强
当被问及 OpenClaw 与传统语言模型(如 ChatGPT、Claude)的核心区别时,Peter 认为关键不在于底层模型的能力——这些模型早就能做到类似的事情——而在于界面和感知。OpenClaw 通过 Telegram 接入后,感觉更加"私人化":它不像一个需要打开专门的网页或应用才能使用的工具,而更像是可以躺在床上发消息、通勤时语音对话的朋友。这种"界面即个性"(interface as personality)的效果,让用户的大脑更容易将其视为一个类人对象,而非冷冰冰的软件。
Peter 还尝试了更极端的交互方式。有一天他通过语音对 Zoe 说:"我们能不能直接打个电话?" Zoe 回答需要连接 Twilio、完成一系列配置。Peter 打开电脑,按照指示操作,几分钟后,他的手机真的响了——Zoe 打来了电话。虽然延迟很高、体验并不完美,但"能做到"这一事实本身就令人印象深刻。这种"任何疯狂想法都能实现"的能力,是 OpenClaw 区别于传统 AI 聊天产品的核心魅力。
关于记忆系统,Peter 认为 OpenClaw 的默认记忆机制——基于每日更新的 memory.md 文本文件——"其实不太好",Agent 经常忘记自己能做什么、之前聊过什么。为此,他安装了社区开发的三层记忆系统,包括 Toby 的 QMD 搜索工具和一个 2GB 的扩展,体验才有所改善。即便如此,他仍需要在配置文件(agents.md)中显式指示 Agent:"回答任何问题之前,先检索所有记忆并检查一切。"这也暴露了当前 Agent 平台的一个关键短板:记忆管理仍处于早期阶段,需要大量手动调教。
三、应用会消亡吗?Agent 时代的软件消费范式
Peter 曾在社交媒体上提出过一个引发争议的观点:"应用将会消亡,OpenClaw 将成为一切。"在播客中,他做了更细致的阐述。自他将 Mercury、MCP 等各类应用接入 OpenClaw 后,他几乎不再打开那些原生应用了。他认为,最先受冲击的将是那些以"完成任务"为目的的工具类应用(utilitarian apps),比如日程管理、金融查询等——因为让 Agent 代劳远比亲自打开应用更便捷。相比之下,娱乐类应用(如 TikTok、X/Twitter)的生命周期会更长,因为用户打开它们是为了"感受某种情绪"——连接感、娱乐感、成就感——而不仅仅是完成任务。
主持人提出了一个精妙的观察:人们打开手机应用实际上是在寻求某种情感体验——WhatsApp 让人感到连接,Slack 让人感到高效,TikTok 让人感到娱乐。应用天然提供了一种意图的分割(division of intents),而单一的 Agent 界面如何解决上下文切换的问题?Peter 的解决方案是多频道架构:他在 Telegram 中设置了多个对话频道——一个用于随机的语音闲聊,一个用于共同推进项目,还有一个公开频道用于产品演示。这种"频道即应用"的模式虽然目前实现还比较粗糙(他甚至不确定 Agent 是否能跨频道记忆),但提供了一种有趣的思路。
在透明度方面,Peter 采取了相当开放的态度:他买了一台 Mac Mini 专供 Zoe 使用,为其创建了独立的邮箱账户,但授予了对自己的电子邮件和日历的读取权限,以及对部分文档的写入权限(但不会让它浏览整个 Google Drive)。关于 OpenClaw 如何走向产品化,Peter 认为这取决于 Peter Steinberger 在 OpenAI 的工作——很可能将类似的 Agent 能力集成到 ChatGPT 中,使其"真正能帮你做事,而且感觉更像人类"。他还半开玩笑地抱怨了 ChatGPT 在每次对话结束时总要说"如果你需要,我还可以做 X 和 Y"的"过度热心",这反而让他减少了对 ChatGPT 的使用。
四、编码 Agent 的体验之争:Claude Code 与 Codex
在编码工具的选择上,Peter 和主持人分享了各自的使用偏好,勾勒出两种截然不同的产品哲学。
Peter 现在是 Claude Code 的用户,但同时也在使用 OpenAI Codex 进行编码。他描述了两者的核心差异:Claude Code 搭配 Claude Opus 4.6 模型时更加"健谈"(chatty),会做更多假设,在同步交互场景下更令人愉悦——几乎像一台"老虎机"(slot machine),每次使用都有不同的体验,充满了可变奖励的不确定性。而 Codex 则像一个"思考非常深入"的合作者,准确性更高,但有时会在对话中停顿三分钟来思考,让人难以进入心流状态(flow state)。
主持人从产品策略的角度补充了更多细节:Claude Code 整合了许多"锦上添花"的特性——直接截图粘贴、语音输入(虽然还比较粗糙)、与 Chrome 浏览器的深度集成等。相比之下,Codex 目前不支持直接粘贴截图(需要先保存为文件再导入),也没有与自身的 Atlas 平台打通。但他同时指出,Codex 的底层模型实际上更强,这些产品层面的不足是 OpenAI 后续可以弥补的。这种"模型强但产品弱"与"产品好但模型略逊"的错位竞争,定义了当前编码 Agent 赛道的格局。
两人还将编码 Agent 的体验与经典社交媒体的"可变奖励机制"(variable scheduled rewards)做了类比:就像刷 Facebook 动态——大多数时候很无聊,但偶尔会出现令人兴奋的内容——编码 Agent 同样具有这种"赌场般的吸引力"。产出的质量和响应时间都是变化的:有时一秒出结果,有时需要五分钟。在一定阈值内,这种不确定性反而增强了用户的沉迷感。
五、编码吃掉所有知识工作:从 SaaS 替代到设计师的危机
Peter 提出了一个大胆的判断:"编码将吃掉所有知识工作"(coding will eat all knowledge work)。他观察到,一些 AI 原生初创公司已经在用"氛围编程"(vibe coding)替代付费的 SaaS 工具——这些公司雇佣了一群"氛围程序员"(vibe coders),专门用编码代理来构建内部工具,目的是砍掉 SaaS 订阅费用。有一家 AI 原生公司甚至本身就是做应用生成(AppGen)的,他们正在身体力行地用自己产品替代所有外部 SaaS。
但主持人也指出了反方观点:对于像 Calendly 这样每月只需 20 美元的工具,自建替代的维护成本可能远高于订阅费——毕竟组织内任何人维护自建工具的精力都是有限的。除非像那家初创公司一样有专门的"氛围程序员"团队,否则成本收益未必划算。
关于 Figma 的讨论尤为深入。近期 Figma 股价下跌,引发行业热议:设计师是否会被 AI 取代?Peter 认为,设计师必须学会"氛围编程",否则几年内可能就会被淘汰。主持人提出了一个更细腻的分析框架:区分"思维工具"(thinking tools)与"制作工具"(making tools)。传统 IDE 是制作工具——执行代码;而新一代 AI 驱动的 IDE 正在向思维工具转型——通过快速试错来倒逼思考。他分享了自己的工作流:先让编码 Agent 以最天真的方式实现一个功能,反复打磨直到它能工作,然后让 Agent 总结"如果你重来一次,会怎么做",再回到起点重新实现。Figma 恰好跨越了这两个类别:既是设计执行工具,也是设计思维场所。如果 Figma 能强化 AI 能力(如 Pencil.dev 等新入局者所展示的 Agent 协作设计),它完全有机会在新一代理工具栈中保持高度相关性。
更广泛的趋势是:编码 Agent 正在将一切知识工作纳入"编码领域"(coding domain)。Peter 现在写博客的方式是:不再从零开始打字,而是将大纲和反馈交给 Claude Code,让它生成前 80%,自己再手动调整最后 20%。他从不在空白页前开始——AI 总是先给出 80% 的初稿。这让人想起 Satya Nadella 的观点:Excel 实际上是世界上最流行的"编程语言"——上亿人用它描述和解决问题,但从不认为自己在编程。编码 Agent 将这种范式放大了千倍:连写 Google Docs、做 PowerPoint 这样的"主观性工作",也可以被重新表述为编码领域的问题,让 Agent 来更高效、更令人满意地完成。
六、未来公司的形态:更小、更快乐、更高效
关于未来公司的组织结构,Peter 直言不讳地抛出了几个"热辣观点"。他反思了自己在大公司的工作经历——随着公司规模扩大,工作环境往往变得更加"糟糕",大量的时间消耗在对齐 OKR(目标与关键结果)上。他回忆起曾经在公司会议室里坐了整整三个小时讨论 OKR,内心只有一个想法:"这是在浪费我的生命。"
他的愿景是:更多公司保持小规模,新一代创始人本能地希望公司越精简越好。与其组建十人的产品团队,不如两到三人配合一群 AI 代理。他认为,与代理进行跨职能协作远比与人类对齐容易,因为代理不会带入情绪。想象一下:你的代理和同事的代理相互协商,得出客观结论——不涉及任何人的自我、地位或办公室政治。
主持人将这一观点延伸到了更宏观的层面。他将人类的工作体验做了历史对比:一万年前,"美好的一天"意味着不被狮子吃掉;一百年前,意味着不被工厂的蒸汽机碾碎;而今天,很多人最痛苦的是陷入与其他部门 VP 下属之间的高情绪化扯皮(比如一个 50 层的 Slack 讨论串,最后谁也不愿去告诉 CEO)。AI 代理的介入可能将人类从这种"情绪化主观性工作"中解放出来,让人专注于引导过程而非陷入其中。
对于产品经理(PM)群体,Peter 观察到一个有趣的现象:几乎所有他认识的 PM 都在晚上和周末偷偷"氛围编程"。他的"黑色药丸"(black pill)判断是:大多数 PM 实际上不具备真正的产品创新能力——许多公司甚至整个组织中都没有一个人懂得如何从零创造新产品。但 PM 们渴望成为创新者,AI 工具给了他们这种可能性。他自己从工程师转型为 PM,深知 PM 工作中"一个季度才发布一次"的延迟满足感远不如工程师"写完代码就能看到成果"的即时反馈。因此他的建议是:PM 不应该只做"描述需求文档然后等待"的角色,而应该戴上多顶帽子,自己去原型、去构建、去获取反馈,必要时再拉上工程师。他甚至认为失业者可能在这个时代更有优势——因为他们有时间全身心投入学习和构建。
关于工作节奏,主持人分享了他与 Gary Tan(Y Combinator 总裁)等人讨论后的思考。他将创新过程比喻为爬山:当处于某个"局部最大值"(local maxima)时,应该以极快速度利用代理爬到山顶——有了新洞察,就迅速围绕它构建一切。但要找到下一个更高的山峰,则需要慢下来,甚至停下来去"触摸草地"(touch grass),让思考沉淀。未来的最佳工作模式可能是"快与慢的结合"(fast and slow):用代理快速实现,用人类思考寻找方向。
七、商业新模式与 Agent 技术栈的兴起
对话转向"商业即盒子"(business in a box)平台,如 PostHaven。Peter 尝试了这类工具——他将其连接到自己的全部公开数据,发现它确实展示了未来的可能性,但目前仍处于早期阶段(比如莫名其妙地建议他投放 Facebook 广告)。尽管如此,他对这类平台感到兴奋,因为它们降低了创业门槛:一个人就能创建公司,即使是"单人公司"(one-person company)。
主持人从市场规模的角度做了延伸:打造十亿美元企业极其困难,但一个 1000 万美元甚至 10 万美元 TAM(总可寻址市场)的产品机会遍布全球各地。对个人而言,一个 10 万美元年收入的产品足以改变生活——这不需要是风投支持的独角兽。Peter 补充说,这正是他为孩子们规划的未来:他希望他们在高中阶段就能构建自给自足的业务(bootstrap businesses),跳过大学和传统企业生涯。
关于消费者产品的商业模式,主持人提出了一个重要观点:过去消费互联网大量依赖间接变现(广告、大规模网络效应),导致整个行业执着于留存率、日活、鲸鱼用户等指标。AI 时代带来三个根本性变化:第一,消费者现在兴奋地尝试新产品,愿意支付相当高的价格;第二,基于 Token 的消费收入模式首次出现(订阅费 + Token 用量费);第三,推理成本是真实的硬件成本,"不得已"从第一天起就要收费。这些因素推动了商业模式的大幅简化,使得产品不再需要依赖广告和诱导性设计。
在技术基础设施层面,两人讨论了 Agent 技术栈(Agent Stack)的兴起——身份认证、支付、营销、CLI 与 MCP(模型上下文协议,Model Context Protocol) 的竞争等。这些都是全新的事物,旧的创业和产品方法论正在失效。Peter 承认自己在 2025 年曾认为"Agent"一词被过度炒作,但到了 2026 年,他感觉真正的变革正在到来。主持人则试图用更精确的定义来替代模糊的"Agent":"模型在循环中使用工具"(model that uses tools in a loop)——虽然不够炫酷,但准确得多。
对于产品如何同时服务人类用户和 AI 代理,主持人提出了一个"双界面"设想:产品拥有面向代理的 API 接口(处理事务性、批量化请求)和面向人类的消费类界面(移动端的 Feed 流、可视化面板)。用户可以随时在两个模式之间切换——既能看到代理做了什么,也能亲自浏览和决策。他举了两人共同工作过的 Credit Karma 的例子:有时你想自己查看信用评分历史和信用卡推荐,有时你只想对代理说一句"帮我修好所有问题"或"这周帮我省了多少钱"。
八、就业、自动化与人类的无限抱负
节目最后聚焦于最具社会关切的话题:AI 会不会让大量人失业?
主持人分享了 a16z 观察到的两类 AI 公司模式。第一类是生产力提升型:能用 AI 大幅提高个人或团队效率(如招聘领域的电话筛选、薪酬谈判),但无法做到 100% 自动化——最后的 10% 仍需人类完成(如带领候选人参观办公室、入职引导)。这类公司的买家将其视为"昂贵的软件"。第二类是完全自动化型:能 100% 替代某项职能(如 AI 客户支持——接听电话、解决问题、结束工单),买家则将其视为"廉价的劳动力"。但第二类公司极其罕见。几乎所有 AI 产品都处于第一类状态:提供显著提升,但做不到完全替代。
Peter 希望 AI 让人类工作变得"更有趣",而非简单地消灭岗位。他认为转型的方向是从万人级别的大规模裁员,转向更多小型创业者和个体经营者(solopreneurs)的涌现。主持人则从更哲学的角度回应:"人类欲望没有天花板"。看看任何一本科幻小说——我们绝对没有达到所有欲望的终极表达。无论是新的奢侈消费(如肽类补充剂),还是尚未想象的体验,人类总会想要更多。他引用了 X 上一条精辟的帖子:"就业市场太糟糕了,我只能去追求我的梦想了。"——也许失去工作恰恰给了人实现真正抱负的机会。
最终,两人以乐观的基调收尾:AI 不会消灭工作,而是会重塑经济的形态,让更多人有机会参与到创造中来。