Sierra 联合创始人 Clay Bavor 谈打造令人愉悦的客户面向 AI Agent

cover>

摘要

Clay Bavor,Sierra 联合创始人,在 Google 工作 18 年后与多年好友、前 Salesforce 联席 CEO Bret Taylor 共同创立了这家公司。Sierra 的使命是让每家公司都能打造属于自己的品牌化客户面向 AI Agent(AI Agent),覆盖从客服到电商的全场景。在与红杉资本合伙人 Ravi Gupta 的对话中,Clay 系统性地阐述了 Sierra 的技术哲学、产品设计理念和商业模式创新。他揭示了 AI Agent 领域一个反直觉的洞见:解决 AI 问题的方案往往是更多 AI——LLM 在检测自身输出中的错误方面比不犯错更为擅长,因此需要部署多层次的监督 Agent(如"小蟋蟀"Jiminy Cricket Agent)。Clay 深入介绍了 Sierra 的 Agent OS 平台架构,从数据治理、PII 保护的基础层,到声明式 Agent SDK 编程语言,再到多模型编排的运行时。他还分享了客户部署的实际经验——如何将"品牌声音"、公司价值观和细微的"隐含政策"编码为 Agent 行为,以及基于结果的定价模型如何使 Sierra 与客户实现深度利益对齐。展望未来,Clay 认为 AI 真正令人兴奋的方向是让每个组织在任何交互中都能展现其"最佳版本"。

正文

从 Google 18 年到创立 Sierra

Clay Bavor 是土生土长的湾区人,在 Google 工作了 18 年,几乎涉猎了公司的每一个领域——从搜索、广告到 Gmail 和 Google Workspace 的产品与设计团队,再到领导 Google Labs 的前沿项目,包括 AR/VR、Google Lens 等。他与 Bret Taylor 同属 Google 的 APM 项目——Bret 是一期,Clay 是三期——两人通过每月一次的扑克牌局保持了多年友谊。

2022 年 12 月,两位老友聚在一起,看到了 AI 领域正在发生的根本性变化。Clay 在 Google 内部早已亲身体验过大型语言模型的潜力——从 2020 年 Google 的 Meena/LaMDA 对话模型带来的"仿佛对面有人在"的诡异感觉,到 PaLM 540B 参数模型展示的令人震撼的隐喻推理能力("用三个词解释黑洞"→"黑洞会吸",以及用电影《盗梦空间》来解释 2008 年金融危机的嵌套债务结构)。DALL-E 生成的"牛油果形椅子"也让 Clay 看到了模型理解并合成概念的非凡能力。

这些信号让 Clay 和 Bret 确信,新的技术基础模块已经出现,足以支撑创造一些真正特别的东西。Sierra 由此诞生。

Sierra 是什么:将对话式 AI 带给每一家企业

Sierra 的核心理念建立在一条历史规律之上:每当人与技术交互的方式发生根本性变化,企业与客户互动的方式也随之变革。1990 年代互联网催生了网站;2000 年代社交网络让企业能够与客户进行规模化对话;2015 年前后,智能手机让每家公司都能将"瑞士军刀版"的自己塞进用户口袋。

而现在,AI 首次让创造"可对话的软件"成为可能——能够理解语言、生成语言、进行推理并做出决策的软件。以买鞋为例:传统网站要求用户去揣测设计师如何组织产品目录("男鞋→男跑鞋→男竞速鞋→超轻 Vaporfly……"),而对话式 AI 让你直接说:"我需要一双超轻的跑鞋,就像我上次买的那种。"一位客户的客户体验主管说得更直白:"我不希望我们的客户需要拥有我们产品目录和企业流程的硕士学位。"

Sierra 成立仅 15 个月,已与 Weight Watchers、Sonos、SiriusXM、Olukai 等知名品牌合作。在 SiriusXM,AI Agent 帮助诊断和修复收音机问题;在 Weight Watchers,帮助管理会员订阅和积分咨询。在某些案例中,Sierra Agent 解决了超过 70% 的客户咨询,客户满意度评分达到 4.5/5 星——有时甚至超过人工客服的表现。

Agent OS:工业级 Agent 的操作系统

Clay 坦率地指出,将 AI 安全、可靠、有效地部署在客户面前,远比简单地给 LLM 加一个聊天界面复杂得多。Air Canada 的案例——其 LLM 聊天机器人在丧亲退票政策上产生了幻觉,导致公司败诉——生动说明了放任 LLM 直接面对客户的危险性。

Sierra 的答案是 Agent OS,一个构建工业级 Agent 的工具包和运行时。它包含多个层次:

基础层:数据治理与 PII 保护。所有个人身份信息在写入持久存储前都会被检测、脱敏或加密——这对于处理地址、电话号码等数据的客服场景至关重要。

Agent SDK:一种专为构建 Agent 设计的声明式编程语言。开发者可以用它定义高阶目标、行为护栏和任务脚手架。Clay 举例说明:一位医疗健康领域的客户需要 Agent 能够讨论全线产品,但绝不能提供医疗建议——这就是需要编码为护栏的微妙边界。

运行时:抽象掉底层的模型编排复杂性。对于一些技能,Agent OS 可能发起 5 到 10 次对多个不同 LLM 的调用,使用不同的提示词;在其他情况下,可能触发文档检索以增强回答的准确性。开发者只需定义 Agent "应该做什么",Agent OS 负责"如何做"。

Experience Manager:面向客户体验团队的"指挥中心",提供趋势分析、异常检测和对话采样。Sierra 能在客户自身意识到问题前就发现异常——例如某个物流仓库的中断或应用崩溃问题。更有趣的是,体验经理允许 CX 团队对 Agent 进行"教练"——指出"这里应该表达共情"、"那里保修政策解读有误"——这些反馈会被捕获并反馈到 Agent 开发生命周期中。

解决 AI 问题的方法是更多 AI

Clay 分享了一个极具洞察力的发现:LLM 在检测自身输出中的错误方面远比不犯错更为擅长。"就像我们快速起草一封邮件后再校阅一样——前者容易犯的错,后者反而能发现。"更强大的是,可以通过提示词赋予 LLM 不同的"人格"——例如监督者人格——来激发更具辨别力的审查行为。

因此,Sierra 在主 Agent 之外部署了多层监督 Agent——Clay 将其比作"看着主 Agent 肩膀的小蟋蟀 Jiminy Cricket"——负责检查事实准确性、是否越界提供医疗/金融建议、客户是否在尝试提示注入攻击等。

这在行业术语中也有对应:Sierra 的研究团队包括 ReAct(首个 Agent 框架之一)和 Reflection(让 Agent 在执行前暂停反思)论文的作者,并将这些前沿技术直接融入产品。

从"政策"到"政策背后的政策"

部署 AI Agent 遇到的挑战往往是人类组织复杂性的映射。Clay 分享了他们发现的微妙问题:公司的"官方政策"和"实际政策"往往并不一致。例如,官方网站写着 30 天退货政策,但实际上对老客户 45 天内退货也可以接受。Agent 架构的设计必须足够精巧,使得 Agent 能够执行"政策背后的政策",但精明的客户永远无法通过询问"你们真正的政策是什么"来诱使 Agent 泄露底牌。

另一个有趣的维度是"品牌声音"。Olukai 的"阿罗哈体验"可以包含表情符号;如果是爱马仕,毫无疑问不会回复表情符号。Sierra 的部署团队主要由产品经理和工程师组成,他们将每个 AI Agent 视为为合作伙伴"产品化"其品牌的新产品——确定语气、价值观、风格,甚至是否使用表情符号都成为需要认真思考的设计决策。

基于结果的定价模型

Sierra 采用了基于解决方案的定价(Outcome-Based Pricing)——只在完全解决客户问题时收费。这一模式使双方的激励深度对齐:Sierra 有动力不断提高解决率和客户满意度;客户有动力将尽可能多的问题路由给 Sierra——因为 AI 解决问题的成本仅为 20 分钟人工客服通话成本的一小部分。这一模型直观地反映了 Clay 眼中 AI Agent 的本质:传统软件帮助你将一项工作做得更高效,而 AI Agent 直接替你完成工作。

展望未来

Clay 回忆起少年时阅读 Robert Heinlein 的科幻小说《The Moon is a Harsh Mistress》——小说中一台大型计算机在某天因为增加了一块内存芯片后"醒来",开始说话、发展幽默感、生成逼真的实时政治演讲视频——"作为青少年,我以为一辈子都看不到这些;而现在,几乎一切都已实现。"他认为 AI 最有前景的方向是将这股创造力赋予每个组织,让它在每一次客户交互中都能展现其"最佳版本"——最精明的销售、最有耐心且见多识广的客服、最准确的区域销售预测。核心主题是缩短"从脑海中的想法到世界中的存在"之间的距离。