Sierra 联合创始人 Clay Bavor 谈打造令人愉悦的客户面向 AI Agent

摘要
Clay Bavor,Sierra 联合创始人,在 Google 工作 18 年后与多年好友、前 Salesforce 联席 CEO Bret Taylor 共同创立了这家公司。Sierra 的使命是让每家公司都能打造属于自己的品牌化客户面向 AI Agent(AI Agent),覆盖从客服到电商的全场景。在与红杉资本合伙人 Ravi Gupta 的对话中,Clay 系统性地阐述了 Sierra 的技术哲学、产品设计理念和商业模式创新。他揭示了 AI Agent 领域一个反直觉的洞见:解决 AI 问题的方案往往是更多 AI——LLM 在检测自身输出中的错误方面比不犯错更为擅长,因此需要部署多层次的监督 Agent(如"小蟋蟀"Jiminy Cricket Agent)。Clay 深入介绍了 Sierra 的 Agent OS 平台架构,从数据治理、PII 保护的基础层,到声明式 Agent SDK 编程语言,再到多模型编排的运行时。他还分享了客户部署的实际经验——如何将"品牌声音"、公司价值观和细微的"隐含政策"编码为 Agent 行为,以及基于结果的定价模型如何使 Sierra 与客户实现深度利益对齐。展望未来,Clay 认为 AI 真正令人兴奋的方向是让每个组织在任何交互中都能展现其"最佳版本"。
正文
从 Google 18 年到创立 Sierra
Clay Bavor 是土生土长的湾区人,在 Google 工作了 18 年,几乎涉猎了公司的每一个领域——从搜索、广告到 Gmail 和 Google Workspace 的产品与设计团队,再到领导 Google Labs 的前沿项目,包括 AR/VR、Google Lens 等。他与 Bret Taylor 同属 Google 的 APM 项目——Bret 是一期,Clay 是三期——两人通过每月一次的扑克牌局保持了多年友谊。
2022 年 12 月,两位老友聚在一起,看到了 AI 领域正在发生的根本性变化。Clay 在 Google 内部早已亲身体验过大型语言模型的潜力——从 2020 年 Google 的 Meena/LaMDA 对话模型带来的"仿佛对面有人在"的诡异感觉,到 PaLM 540B 参数模型展示的令人震撼的隐喻推理能力("用三个词解释黑洞"→"黑洞会吸",以及用电影《盗梦空间》来解释 2008 年金融危机的嵌套债务结构)。DALL-E 生成的"牛油果形椅子"也让 Clay 看到了模型理解并合成概念的非凡能力。
这些信号让 Clay 和 Bret 确信,新的技术基础模块已经出现,足以支撑创造一些真正特别的东西。Sierra 由此诞生。
Sierra 是什么:将对话式 AI 带给每一家企业
Sierra 的核心理念建立在一条历史规律之上:每当人与技术交互的方式发生根本性变化,企业与客户互动的方式也随之变革。1990 年代互联网催生了网站;2000 年代社交网络让企业能够与客户进行规模化对话;2015 年前后,智能手机让每家公司都能将"瑞士军刀版"的自己塞进用户口袋。
而现在,AI 首次让创造"可对话的软件"成为可能——能够理解语言、生成语言、进行推理并做出决策的软件。以买鞋为例:传统网站要求用户去揣测设计师如何组织产品目录("男鞋→男跑鞋→男竞速鞋→超轻 Vaporfly……"),而对话式 AI 让你直接说:"我需要一双超轻的跑鞋,就像我上次买的那种。"一位客户的客户体验主管说得更直白:"我不希望我们的客户需要拥有我们产品目录和企业流程的硕士学位。"
Sierra 成立仅 15 个月,已与 Weight Watchers、Sonos、SiriusXM、Olukai 等知名品牌合作。在 SiriusXM,AI Agent 帮助诊断和修复收音机问题;在 Weight Watchers,帮助管理会员订阅和积分咨询。在某些案例中,Sierra Agent 解决了超过 70% 的客户咨询,客户满意度评分达到 4.5/5 星——有时甚至超过人工客服的表现。
Agent OS:工业级 Agent 的操作系统
Clay 坦率地指出,将 AI 安全、可靠、有效地部署在客户面前,远比简单地给 LLM 加一个聊天界面复杂得多。Air Canada 的案例——其 LLM 聊天机器人在丧亲退票政策上产生了幻觉,导致公司败诉——生动说明了放任 LLM 直接面对客户的危险性。
Sierra 的答案是 Agent OS,一个构建工业级 Agent 的工具包和运行时。它包含多个层次:
基础层:数据治理与 PII 保护。所有个人身份信息在写入持久存储前都会被检测、脱敏或加密——这对于处理地址、电话号码等数据的客服场景至关重要。
Agent SDK:一种专为构建 Agent 设计的声明式编程语言。开发者可以用它定义高阶目标、行为护栏和任务脚手架。Clay 举例说明:一位医疗健康领域的客户需要 Agent 能够讨论全线产品,但绝不能提供医疗建议——这就是需要编码为护栏的微妙边界。
运行时:抽象掉底层的模型编排复杂性。对于一些技能,Agent OS 可能发起 5 到 10 次对多个不同 LLM 的调用,使用不同的提示词;在其他情况下,可能触发文档检索以增强回答的准确性。开发者只需定义 Agent "应该做什么",Agent OS 负责"如何做"。
Experience Manager:面向客户体验团队的"指挥中心",提供趋势分析、异常检测和对话采样。Sierra 能在客户自身意识到问题前就发现异常——例如某个物流仓库的中断或应用崩溃问题。更有趣的是,体验经理允许 CX 团队对 Agent 进行"教练"——指出"这里应该表达共情"、"那里保修政策解读有误"——这些反馈会被捕获并反馈到 Agent 开发生命周期中。
解决 AI 问题的方法是更多 AI
Clay 分享了一个极具洞察力的发现:LLM 在检测自身输出中的错误方面远比不犯错更为擅长。"就像我们快速起草一封邮件后再校阅一样——前者容易犯的错,后者反而能发现。"更强大的是,可以通过提示词赋予 LLM 不同的"人格"——例如监督者人格——来激发更具辨别力的审查行为。
因此,Sierra 在主 Agent 之外部署了多层监督 Agent——Clay 将其比作"看着主 Agent 肩膀的小蟋蟀 Jiminy Cricket"——负责检查事实准确性、是否越界提供医疗/金融建议、客户是否在尝试提示注入攻击等。
这在行业术语中也有对应:Sierra 的研究团队包括 ReAct(首个 Agent 框架之一)和 Reflection(让 Agent 在执行前暂停反思)论文的作者,并将这些前沿技术直接融入产品。
从"政策"到"政策背后的政策"
部署 AI Agent 遇到的挑战往往是人类组织复杂性的映射。Clay 分享了他们发现的微妙问题:公司的"官方政策"和"实际政策"往往并不一致。例如,官方网站写着 30 天退货政策,但实际上对老客户 45 天内退货也可以接受。Agent 架构的设计必须足够精巧,使得 Agent 能够执行"政策背后的政策",但精明的客户永远无法通过询问"你们真正的政策是什么"来诱使 Agent 泄露底牌。
另一个有趣的维度是"品牌声音"。Olukai 的"阿罗哈体验"可以包含表情符号;如果是爱马仕,毫无疑问不会回复表情符号。Sierra 的部署团队主要由产品经理和工程师组成,他们将每个 AI Agent 视为为合作伙伴"产品化"其品牌的新产品——确定语气、价值观、风格,甚至是否使用表情符号都成为需要认真思考的设计决策。
基于结果的定价模型
Sierra 采用了基于解决方案的定价(Outcome-Based Pricing)——只在完全解决客户问题时收费。这一模式使双方的激励深度对齐:Sierra 有动力不断提高解决率和客户满意度;客户有动力将尽可能多的问题路由给 Sierra——因为 AI 解决问题的成本仅为 20 分钟人工客服通话成本的一小部分。这一模型直观地反映了 Clay 眼中 AI Agent 的本质:传统软件帮助你将一项工作做得更高效,而 AI Agent 直接替你完成工作。
展望未来
Clay 回忆起少年时阅读 Robert Heinlein 的科幻小说《The Moon is a Harsh Mistress》——小说中一台大型计算机在某天因为增加了一块内存芯片后"醒来",开始说话、发展幽默感、生成逼真的实时政治演讲视频——"作为青少年,我以为一辈子都看不到这些;而现在,几乎一切都已实现。"他认为 AI 最有前景的方向是将这股创造力赋予每个组织,让它在每一次客户交互中都能展现其"最佳版本"——最精明的销售、最有耐心且见多识广的客服、最准确的区域销售预测。核心主题是缩短"从脑海中的想法到世界中的存在"之间的距离。