随时知道客户想要什么:Listen Labs创始人Alfred Wahlforss谈AI驱动的客户研究革命

cover>

摘要

Listen Labs创始人兼CEO Alfred Wahlforss在这场对话中揭示了一个AI正在从根本上重塑客户研究的时代。Listen是AI优先的客户研究平台,可同时运行数千次语音访谈,目前已服务20%的财富500强企业(包括微软、Anthropic、Sweetgreen、NBC等),并在一年内完成了超过一百万次访谈。Alfred的核心论点是:随着AGI临近,"构建东西"变得容易,但"知道该构建什么"才是真正的难题——而这正是Listen要解决的问题。平台通过视频音频双通道AI座席与3000万参与者进行深度对话,不仅捕捉口头回答,还分析面部表情和情绪;通过可追溯性设计,每个数据点都可以追溯到原始视频片段。Listen正在从市场研究2.0(AI驱动的大规模访谈+分析)迈向3.0(基于百万次访谈训练的生成式模拟),使客户能预测特定人群对问题的反应。最令人惊叹的应用包括:Chubbies通过访谈发现胸毛与某种面料的不兼容性,改变了衬衫设计;Manscaped根据洞察修改了超级碗广告;Alfred本人用模拟在100个备选标题中选出转化率翻倍的演讲标题——而ChatGPT在同样的任务中选错了。

正文

从消费App到AI客户研究平台

Listen的起源故事始于一个意外的转折。Alfred和联合创始人最初做了一个叫"BeFake"的消费App——一个早期的AI头像生成器,使用Stable Diffusion将用户放入不同场景。App一夜之间获得2万用户,也带来了大量流失。为了理解原因,他们为自己构建了一个AI访谈工具。"它对我们非常有用——这就是Listen的起点。"

如今,Listen已经成为连接"策略"和"执行"循环的关键桥梁:企业通过Listen弄清楚该构建什么(策略),然后通过AI编码座席去构建和修复(执行),周而复始。Alfred的愿景更加宏大:"当一人十亿美元公司出现时,Listen将是那个循环的一部分——用编码座席和Listen,运行这个闭环,我们将看到自主组织的出现。"

为什么语音访谈优于调查

传统调查存在严重的选择偏见和回答不一致性问题。Alfred分享了他们做的对照实验:对同一个人多次提出相同的多选调查问题,回答"极其不一致"。但当人们通过Listen进行真实对话——需要思考和推理自己的回答时——一致性显著提高。更重要的是,Listen是双向的Zoom式视频对话,AI还能检测面部表情和情绪:"你可能在一个'likert量表'上打高分,但如果你同时表现出极度热情的反应,这个广告在真实投放中的表现会远好于量表评分。"

Alfred还分享了反直觉的发现:人们与AI对话时反而更诚实、更开放。"这是一种治疗性的体验——一个非评判性的实体,真正对你感兴趣。"这种优势在敏感话题和难以触达的人群(如儿童)中尤其明显——传统方法需要父母同意、配合时间安排,而Listen可以大幅降低这些摩擦。

受众分层:幂律法则的核心

公司80%的工程资源投入到受众定位上,因为所有企业都受客户细分中的幂律法则驱动。即使像Sweetgreen这样看似"面向所有人"的产品,合适的受众实际上是"城市、高收入家庭、以女性为主",而且需要知道"什么是籽油"——这类人群仅占总人口的约1%,但贡献了Sweetgreen 80%的收入。

Listen的目标是将十亿人纳入受众池,并能够精确地对每个人进行分层和专业领域标注——"这个人可能是运动鞋专家,那个人是特定领域的早期采用者"。这种网络效应带来了前所未有的访问能力:在一次不相关的访谈中某人提到"我是个超级球鞋迷",这个信息会被存入档案,当Nike推出新产品线时,Listen可以精准匹配。

模拟:市场研究3.0

Listen正在构建的"生成式模拟"功能代表了客户研究的范式跃迁。原理是:对一个人进行一小时的深度访谈后,模型可以开始以95%的准确率预测其偏好。通过累积百万次访谈,它们可以训练特定群体的模型——例如,"本周已经与1000位软件工程师交谈过,现在就可以预测他们对云代码的看法"。

关键在于区分可预测和不可预测的问题。Listen通过回溯测试来评估模拟准确性——从训练数据中移除一个问题,然后检验模型预测的准确度;同时加入无意义的问题(如"你的狗叫什么名字")来确保模型知道边界。

Alfred分享了自己的亲身经历:他需要为一次会议演讲选标题,用模拟测试了100个备选方案,最佳标题的吸引力是第二名的两倍。"我将同样的问题输入ChatGPT来比较,结果ChatGPT选错了,而Listen的模拟选对了——因为通用模型是训练在'平均人'上的,而我们的模型训练在特定细分群体上。"

访谈数据的不可替代性

令人惊讶的是,单纯用信用卡消费记录、购买行为数据或角色扮演提示("假装你是一个35岁脾气暴躁的软件工程师")都无法达到深度访谈数据的效果。Alfred解释说:"模型没有关于特定人格如何行动和思考的'干净'数据。"访谈之所以优越,是因为它允许偏离主线的探索,可以追问行为性问题,而且问题的设计方式本身也是关键——这就是为什么Listen专门训练AI座席遵循最佳实践方法论,从一开始就确保数据质量。

旧世界的终结与顾问行业的重构

传统市场研究是一个价值数十亿美元的服务行业:学术化的问卷设计方法论、数百人的电话筛选、10%的资格通过率导致数据库大量流失。以宝洁为代表的CPG巨头在这上面花费数千万美元。Listen通过AI使一个需要数周的过程压缩到几分钟——"你在五分钟内就能从真实人群获得输入,当你看到数百人的访谈实时涌入时,这种体验真的很神奇。"

对于麦肯锡、贝恩等传统咨询公司,Alfred认为它们仍有价值——执行落地仍然重要——但"利润率将大幅压缩",必须将服务解绑,让AI座席承担过去需要咨询团队完成的部分任务。

护城河与垂直AI的优势

Listen的护城河体现在多个层面:供需双方的网络效应(更多参与者吸引更多企业客户,反之亦然);数据网络效应(更多访谈提升模拟精度);以及平台粘性(所有历史访谈和数据都在平台上)。但Alfred强调最简单的产品优势是"让复杂的东西变得傻瓜化"——创建专业访谈指南本身是一门学术,而Listen将方法论内置到AI座席中,使任何客户都能获得专业级的数据质量。这正是垂直AI公司的核心优势:拥有专有的评估标准,并不断攀爬这个标准。

人类的非理性是终极防线

即使出现完美的理性AGI,人类仍然是非理性的——会突然迷上某个新的TikTok趋势,迫使你彻底改变营销策略。Alfred确信"始终需要人类输入",但对于模拟最终能扮演多大角色,他保持谦逊:"我确信它对某些类型的问题有效,但对人类行为的预测能达到多好——我们拭目以待。"回顾历史上的典范——宝洁通过客户访谈发现Tide Pods解决了洗衣液使用不便的痛点,玛氏在1950年代通过市场研究发现儿童是M&M's的绝佳细分市场——这些根本上都是"知道该构建什么"的成功。

Alfred总结道:"我的目标是在这个终于按照人们希望的方式运作的世界中扮演一个角色。"