为终端正名：AI 时代开发者的终极工作台 —— Warp 创始人 Zach Lloyd 访谈

cover Sequoia Capital · 2026-01-27🎬 在 YouTube 观看原视频 →>

摘要

Warp 创始人兼 CEO Zach Lloyd 在本期访谈中提出了一个大胆的论点：终端（terminal）正在成为 AI 驱动开发的中心，而且这一趋势并非偶然——终端基于文本输入输出的时间序列特性，天然契合代理式（agentic）工作流的本质。从 Google Docs 工程负责人到全力押注终端重造，Zach 分享了他对编码市场竞争格局的冷峻研判：模型厂商正在蜂拥进入应用层，API 层的商业模式面临严峻挑战。他进一步揭示了一个反直觉的洞见：编码（coding）本身将在数年内被模型"解决"，真正的瓶颈将不再是模型能力，而是人类清晰表达意图（intent）的能力。访谈还涵盖了 Warp 从订阅制转向消费制定价的艰难决策、环境代理（ambient agents）如何从系统事件自动触发并彻底改变开发团队的工作模式，以及终端与 IDE 正在融合为一种全新工作台的产品演进方向。

正文

终端：被低估的代理原生界面

Zach Lloyd 的职业生涯起点在 Google，他曾是 Google Docs 的工程负责人，亲历了协作式生产力工具的范式变革。当他开始构想 Warp 时，终端这个看似过时的工具进入了他的视野。他的观察犀利而直白："终端的经典版本是一个糟糕的产品。难以学习，容易出错，鼠标完全不起作用。"但终端在技术栈中的位置赋予了它无可替代的强大能力——关键用户可以用它完成大量工作。

Warp 最初五年致力于重塑终端的单人使用体验：重新设计输入方式、输出方式，让工具在不削弱能力的前提下变得更加易用。但生成式 AI 和编码模型的爆发，意外地将终端推向了更重要的位置。

Zach 解释了为什么终端是代理式开发的理想形态："一切基于文本的输入和输出，天然记录日志，可以在终端中轻松实现代理的多任务并行。"相比之下，集成开发环境（Integrated Development Environment, IDE）更像是代码的"Microsoft Word"——一个编辑和查看代码的图形用户界面（Graphical User Interface, GUI），而终端则是与计算机对话的通道。在代理优先的世界里，"对话"变成了主要交互模式，而手工编辑降级为后备方案或次要界面。

编码市场：最残酷的竞争地带

编码工具市场是 Zach 所见过竞争最激烈的软件细分领域。Warp 的差异化在于其终端原生的基因：所有从 IDE（尤其是 VS Code fork）发展而来的产品大同小异，所有纯文本终端应用也基本雷同，而 Warp 是唯一从终端出发、向上扩展为通用代理开发工作台的平台。

这一出身带来了天然优势。在 Terminal Bench 上，Warp 通常排名第一或第二；在 SWE-bench 上也稳居前五。终端原生意味着 Warp 能处理"终端使用"（terminal use）——类似于浏览器使用（browser use）——在终端层面进行计算机操作，而不仅仅是在模拟网页上操作。例如，当评估任务要求玩 Zork 这样的交互式终端游戏时，Warp 可以直接在终端内完成，而其他工具则难以做到。

但竞争压力巨大，尤其是来自模型厂商的降维打击。Anthropic、OpenAI 和 Google 可以凭借模型利润补贴其编码工具，以极低甚至免费的价格抢占市场。Zach 的应对策略是双管齐下：一方面向上走高端市场，面向专业开发者（pro developers），他们看重产品体验胜过几十美元的价格差异；另一方面通过模型路由（model routing）和混合模型策略，让用户在使用成本上获得优势——Gemini 3 Pro 等非 Anthropic 模型已经接近或追平了 Claude 的编码能力。

Zach 明确表示不会训练自己的前沿模型（那需要天文数字般的资本），但会在微调（fine-tuning）和强化学习（Reinforcement Learning, RL）方面投入。Warp 拥有海量的开发者工作流数据——"人们在终端中做什么，如何与代理交互，这些都是非常有趣的战略资产。"

从订阅制到消费制：一次痛苦的定价转型

Warp 的定价演进是一个经典的教训。最初的定价是订阅制+固定 AI 额度——如果用户完全用满额度，Warp 会亏钱；靠大多数用户使用不足来维持盈利。但用户的 AI 使用量持续攀升，Warp 陷入了增长越快亏损越多的困局。

Zach 面临一个抉择：继续烧钱换增长（玩资本游戏），还是从根本上重构商业模式。他选择了后者，转向消费制定价——20 美元基础月费加上按需购买的额度。"我们不可能在成本竞争中取胜。我想知道的真正问题是：用户会为价值付费吗？当我们实现正毛利时，他们还会付费吗？"

转型伴随着大量用户抱怨——"如果有任何客户在听，我真的很抱歉，这确实很糟糕。"但 Zach 认为这是必要的阵痛：新模式下，用户使用更多 AI 是好事而非负担，增长变得可持续，不再依赖补贴式的虚假繁荣。

基座工程：让代理变好的秘诀

Zach 将代理基座（agent harness）分解为几个核心要素：提示词（prompting）、可用工具集（tool set definition）、上下文窗口管理（context window management）。上下文管理尤为关键——当一个终端命令输出海量内容时，如何挑选相关部分放入上下文窗口？何时使用子代理（sub-agent）开辟独立上下文空间？何时摘要、何时截断？

让基座变好的方式是测量。Warp 采用三重测量体系：一是内部固定评估集（已知正确答案的测试用例）；二是公共基准测试（如 Terminal Bench 和 SWE-bench），实际上跑通这些基准已成为打磨代理的重要练习；三是用户数据驱动的模式分析——通过 Braintrust 等平台发现代理交互中的失败模式，然后复现为评估用例来调优基座。

Zach 强调，这种数据驱动的方法论是一个重大心态转变，但"百分之百必要，否则不可能达到好效果。"

环境代理：下一个前沿

Zach 认为未来一年最大的变化将是环境代理（ambient agents）或云端代理（cloud agents）的崛起。与当前开发者端坐在键盘前输入提示的模式不同，环境代理由系统事件触发——服务器崩溃、用户报告激增、安全事件——这些事件作为上下文被注入代理，代理在云端而非个人机器上运行，自主采取行动。

这需要全新的工作台形态：从单纯的代理交互工具演化为编排平台（orchestration platform）——一个管理团队所有代理的"驾驶舱"（cockpit）。Zach 描绘了未来的工作流："代理会提交 PR、会在 PR 上留下初步审查意见、会在任务跟踪系统中提交工单。所有这些都需要追踪和协调，需要不同的方式集成到现有系统中。"

Warp 的架构正在从"产品"向"平台"转型，涵盖三层：代理 SDK、代理托管（让不想自己维护云基础设施的小团队直接使用）、以及管理界面——查看所有代理的状态、日志、谁启动了它们、何时产生了 PR。

Zach 坦承仍在纠结产品形态——是作为 Warp 的一个功能模块，还是独立产品？捆绑的优势在于云端任务与本地开发的无缝衔接：Slack 中标注一条消息要求修改按钮位置，代理在云端完成工作，然后开发者一键拉取到本地继续——这种"一站式环境"极具体验价值。但编排仪表盘的 Web 属性更强，可能更适合独立产品。

编码将被解决，真正的瓶颈是表达意图

在被问及超级智能时，Zach 给出了一个清醒的回答："我不知道会不会出现超级智能。但我确实认为编码将被模型解决。我们最终会遇到的瓶颈是人类的意图表达。"

他的推理链条耐人寻味：当人们从写代码转向用英语描述需求时，实际上重新引入了模糊性。"这像是一种倒退，但又比手动编码高效得多。"代码本身是意图的最精确表达——而我们现在让一个翻译层（模型）夹在中间。当模型在编码层面足够好时，差异将体现在谁能最准确地将人类需求翻译为代码。

这一判断对编码市场的竞争格局有深远影响。Zach 认为，一旦编码被"解决"——即无需前沿模型就能产出与人类意图匹配的代码——API 层的商业模式将受到严重挤压。"这就是为什么你会看到 Anthropic、OpenAI 和 Google 如此激进地进入应用层——API 层的风险太大。仅就编码这个垂类而言，我认为几年内就会被基本解决。"

关于代理能力现状，Zach 给出了一个"六分"的评分（满分十分）。代理可以很好地完成中等复杂度的任务——他最近通过 Slack 标注让代理完成了一个 300 行代码的 PR，基本正确。但它们还无法执行庞大项目、不值得信赖来做根本性架构决策。代理已不再是"改按钮颜色"级别的简单工具——它们是真实的、改变游戏规则的存在——但尚未达到替代全职工程师的水平。

最大的瓶颈包括：上下文窗口限制及注意力衰减问题、代理每次都需要从头"重新学习"一切（缺乏持续学习能力）、以及行业尚未形成代理使用的最佳实践和标准化方法。

上下文工程与验证闭环

Zach 对代码产生的错误率保持乐观。一个有趣的里程碑是：大约四五个月前，代理生成的代码不到 100% 能编译通过；而现在，他对 Warp 代码库的代理输出编译通过率接近 100%。但这只是"静态正确"——代码中仍有逻辑错误和 bug。

真正需要的是"行为正确"。Zach 认为浏览器使用和计算机使用是关键的验证环节——让代理不仅做出修改，还能从用户视角验证修改是否真正有效。各大模型厂商的计算机使用 API 都处于测试阶段，而一旦这个验证闭环建立，强化学习将变得更容易，"行为正确"而不仅仅是"编译正确"将成为新标准。

结语：Ask and Adjust

Zach 在 2023 年 ChatGPT 刚发布后不久写了一篇博客文章，核心论点是：生产力工具的主界面将从"手工编辑"（hand editing）转向"Ask and Adjust"——由 AI 生成初稿，人类负责调整（重新提示或手动修改）。三年后回顾，他认为这个判断基本正确，尤其在编码领域已充分验证。

他还自嘲地提到 Warp 首创了"Agent Mode"这个术语，如今已被全行业广泛使用，可惜没能注册商标收版税。这个笑谈背后的事实是：Warp 确实精准捕捉了代理式开发的范式转变——人类不再亲自编写每一行代码，而是扮演督导者和调整者的角色。在这个新范式中，终端凭借其简洁、日志化和文本原生的特性，正在成为 AI 时代开发者最重要的工作台。