Google NotebookLM 产品负责人 Raiza Martin 与 Jason Spielman:源数据驱动的 AI 潜力

摘要
NotebookLM 是 Google 内部一个起初仅为 20% 时间项目的实验性产品,却在 2024 年因其"音频概览"(Audio Overviews)功能一夜爆红,被许多人称为"Google 的 ChatGPT 时刻"。这个由约 10 人小团队打造的产品,最神奇的地方在于:你上传任何文档、网页或文本,它就能自动生成一段由两位 AI 主持人对话的、极其逼真自然的播客节目。
在本期对话中,NotebookLM 的产品负责人 Raiza Martin 和设计负责人 Jason Spielman 深入分享了这款产品的诞生故事、设计哲学和未来发展愿景。NotebookLM 的核心理念是"源数据驱动"(Source-Grounded)——与 ChatGPT 或 Gemini 这样的通用聊天 AI 不同,它要求用户先上传资料,然后仅基于这些资料生成回答和内容。这种设计既确保了信息的可靠性,也为个性化内容创作打开了一扇新的大门。
从最初的项目代号"Talk to Small Corpus"(与小型语料库对话),到如今用户用它来制作简历播客、解读 2004 年的日记、甚至将群聊记录转化为通勤途中的"听力材料",NotebookLM 正在重新定义什么是"个性化内容"。Raiza 和 Jason 分享了他们在 Google 内部如何像初创公司一样"以发布为北极星"(the North Star is to ship),以及他们对 AI 设计思维的深刻洞察——包括所谓的"Skeuomorphic AI Era"(仿物化 AI 时代)。
正文
"这不就是我的 ChatGPT 时刻吗?"
当被问及 NotebookLM 的爆红是否算是 Google 的"ChatGPT 时刻"时,Raiza 的反应既谦虚又自豪:"ChatGPT 对我来说太重要了,所以听到这种比较我有点'哇哦'。但我认为我们看到的共同点是,人们在使用产品后产生了同样的感受——'哇,这就是 AI,这就是 AI 能做到的事情。'这真的很酷。"
Jason 补充道:"当我第一次听到音频概览时,当第二位主持人突然加入对话的那一刻——那真的是一个震撼心灵的体验。"他认为这种震撼源于多重因素的叠加:Gemini 1.5 Pro 模型强大的长上下文处理能力,Google 的语音合成模型,以及 NotebookLM 团队自研的"Content Studio"编辑器系统。
NotebookLM 最初是一个 AI 驱动的研究和写作工具。但如今,人们更普遍地将它认知为"上传一个来源,它就会为你生成一段播客"。这个转变是如何发生的?"我们一直在探索不同的输出模态,"Raiza 解释道,"声音是下一个方向,我们选择了对话形式。但我们当时并没有预料到它会如此成功——我认为这确实很神奇,但人们对此的反应让人感到惊喜和愉悦。"
从一个 20% 项目到全球爆款
NotebookLM 的起源可以追溯到一位工程师的 20% 时间项目——一个名为"Talk to Small Corpus"的滑稽内部项目。Raiza 回忆道:"我第一次听到'corpus'(语料库)这个词时,完全不知道那是什么。但这位工程师解释说,核心想法是让你可以使用大语言模型(Large Language Model,LLM)与你的数据进行对话,从中提取信息。"
作为一名"成人学习者"(重返校园的学生),Raiza 立刻意识到了这个想法的潜力:"如果我能用 LLM 与教材对话——这将改变我的生活,改变无数人的生活。"2023 年 5 月,这个项目以"Project Tailwind"的代号首次亮相:用户上传 PDF,然后可以与之聊天。
Jason 指出,NotebookLM 与众不同之处的核心在于"源数据驱动"。"我最初甚至没有意识到,我生命中创造的几乎所有东西,背后都有某种先前的文档或资料作为基础。"在 NotebookLM 中,左侧面板清晰地显示所有上传的源文件,提醒用户:你的对话是建立在这些来源之上,而非模型的自由发挥。
音频概览背后的魔法
音频概览的制作并非简单的文本转语音(Text-to-Speech)。Jason 描述了背后的技术栈:"核心是 Google 的模型——Gemini 1.5 用于消化你提供的所有数据并生成新内容,语音模型用于音频合成。但真正的'动力引擎'是我们内部构建的 Content Studio——它在你的原始内容和最终播客之间扮演着编辑的角色,为我们提供了一定的'编辑自由度'(editorial liberty)。"
这种"编辑自由度"意味着两位 AI 主持人拥有各自的人设和处理信息的方式,他们会基于上传的材料自行决定如何展开对话。Raiza 表示,即便是她自己,也总是好奇两位 AI 主持人这次会如何演绎这段材料。
当被问及是否会开放更多控制权给用户时(如"让这段更搞笑"或"让这段更严肃"),Jason 表示团队正在慎重考虑。"我原本的第一反应是'好吧,让我们把所有的旋钮都发布出去',但我现在试图保持更多的纪律性——人们爱上这个产品是因为它的魔力和愉悦感,我如何能发布'有魔力和愉悦感的旋钮'?"
令人惊喜的使用场景
虽然 NotebookLM 最初瞄准的是教育场景(学生和教师用它来与教材对话),但实际涌现的使用场景远超预期。
企业内部知识分发:Google 内部的广告销售团队将数百页的产品文档和培训资料上传到 NotebookLM,资深员工(像"Joe"这样的专家)创建笔记本后分发给数百名销售同事。当销售人员在客户电话中被问到不确定的问题时,他们可以快速查询笔记本获取答案——不再需要等待 Joe 回复邮件。
私募股权和风投:Raiza 的一位在风投工作的朋友告诉她,他使用 NotebookLM 来处理机密信息备忘录(Confidential Information Memorandum,CIM)。"他把我拉过来说,'我 10 倍加速了我的工作速度'。"
最疯狂的例子:有人上传了一份只包含"poop"和"fart"两个词反复重复的文档,结果生成的播客居然异常精彩。Jason 在半夜看到这个例子时,纠结要不要点击播放:"如果这是个安全风险,我得开 Bug 工单,今晚就别想睡了。但我还是听了——结果难以置信地好,甚至比我能想象的还要好。我当时心想:'干得好,小 NotebookLM,解决正确的问题。'"
另一个让人印象深刻的案例是,一位女士上传了她 2004 年的日记,并录制了自己听 AI 播客讨论她日记的反应视频——这种个性化的、自我反射式的使用方式完全超出了团队的预期。
"Skeuomorphic AI Era"与设计哲学
Jason 提出了一个有趣的概念——"Skeuomorphic AI Era"(仿物化 AI 时代)。他解释说:"Skeuomorphism 是指虚拟物体模仿真实世界物体的设计风格,比如早期 iOS 中带有皮革纹理边框的日历应用——这是为了让用户更容易从物理世界过渡到虚拟世界。我认为我们现在在 AI 领域看到了类似的现象:我们需要构建能让用户感到熟悉的界面,因为对许多人来说,这是他们第一次与人工智能交互。"
NotebookLM 的对话式播客正是这一哲学的体现——它采用了人们熟悉的"播客"格式,降低了用户接受 AI 生成内容的心理门槛。但 Jason 也在思考下一步:"现在很多人使用 AI,他们想要控制权。我们正在探索如何在不过度复杂化的情况下提供这种控制。"
在 Google 内部像初创公司一样行动
主持人提出了一个敏感但关键的问题:NotebookLM 的快节奏、小团队、紧密用户反馈的运作方式,似乎更符合人们对初创公司的刻板印象,而非 Google 这种大公司的风格。
Raiza 坦诚地分享了她的经验:"在 Google 内部,Google 给我最好的两样东西是:一,在模型完全准备好之前就能接触到它们——了解即将到来的能力,这让我能以不同的方式思考产品设计;二,人才——极其聪明、有才华且热爱协作的同事。"
但她也承认,在 Google 内部"不发布"比"发布"更容易。"在我的 Google 经历中,有很多次我怀疑自己——'这会影响这个吗?会影响那个吗?要考虑的因素太多了。'但一旦你把心态转变为'不,北极星就是发布,你必须不惜一切代价做到这一点',一切就变了。"
她还分享了一个"小秘密":"我们制造了很多虚假的截止日期。我会说'10 月 10 日,必须发布',团队问'那还有两周',我说'对啊,我们怎么办?'于是大家就开始全力以赴。大多数时候,没人会追问'10 月 10 日到底有什么特殊含义'。这个方法用两年了,一直有效。"
未来的方向:从播客到全模态创作
当被问及 NotebookLM 的未来时,Raiza 的思路清晰而广阔。短期内,她最遗憾的是没有更好的分享体验——"当我在 X(Twitter)上滚动时,看到人们用各种视频工具和可视化工具来分享他们的音频概览,而不是用我们的原生功能,作为一个产品负责人,我感到很遗憾。"
中期来看,她希望深化写作体验。"我们注意到人们经常进行 Q&A 对话,然后把答案拿出去创作新的东西。我们希望能满足整个用户旅程——从提问到创作。"
在更长远的愿景中,Jason 正在实验更多模态的输入和输出。他最近的一个实验是用语音日记——"我不再写日记了,而是来回与 AI 对话,它为我生成日记记录,然后创建可视化——本周你的好日子比坏日子多,这些是让你开心的事情,那些是让你沮丧的事情。"他相信,个人化的、源数据驱动的 AI 应用场景将是 NotebookLM 下一步的重要方向。
在对话中,两位 AI 播客主持人突然"闯入"并接管了节目的结尾部分,完美呈现了 NotebookLM 的核心体验。Raiza 和 Jason 承诺:"保持好奇心,我们会继续深入研究,为你们带来更好的选择。"