Dust 联合创始人:多模型、多智能体的 AI 未来

cover>

摘要

在 2023 年初,大多数人相信"一个模型将统治一切"时,Gabriel Hubert 和 Stanislas Polu 创立了 Dust——一个让企业构建、分享和部署个性化 AI 助手的统一平台。他们的核心理念在当时显得反直觉:未来不会有单一模型主宰,而是多个模型共存,用户需要在不同场景下灵活切换。

两位创始人有着独特的背景。Stanislas 曾在 OpenAI 担任关键研究员(2019-2022),与 Ilya Sutskever 团队合作发表了多篇重要论文,专注于数学与 AI 的交叉领域。Gabriel 则在 Stripe 等公司积累了丰富的产品经验。两人是第二次创业的连续创业者。

Dust 的洞察在随后近两年内被反复验证:开源模型生态繁荣、企业需要多模型策略(从本地部署的小模型到云端前沿模型的组合)、微调(fine-tuning)不是解决企业数据接入的正确方式。他们认为,真正的瓶颈不是模型质量,而是产品和工程层面的创新——尤其是在模型之上的应用层。

今天,Dust 观察到一种独特的使用模式:企业内部的使用从少数明确用例开始,然后横向扩散,最终覆盖约 70% 的员工——每个员工创建自己的个性化 AI 助手。Dust 成为发现企业内"高潜力人才"的热力图:那些最积极构建 AI 助手的人,往往也是最具探索精神和成长潜力的员工。

正文

反共识的起点:多模型世界的预见

"2023 年初创立 Dust 时,大家似乎都相信一个模型将统治一切——当时是 GPT-3.5 或者即将到来的 GPT-4。"Stanislas 回忆道。但 Dust 创始团队的判断截然不同。

他们的理由是双重的。首先,从市场动态来看,多个实验室已经在同时涌现——对于行业内的人来说,竞争格局非常清晰,只是普通大众尚未察觉。"对我们来说,多模型竞争是自然而然的——因此,让用户能够快速从一个模型切换到另一个模型、以根据用例获取最佳价值,这本身就具有巨大价值。"

其次,从使用场景来看,安全性和数据敏感度要求会催生不同的部署需求。"我们看到人们开始考虑在某些场景下在端侧运行小模型——你可能需要一个组合:对敏感度低的任务调用 API 访问前沿模型获取最强推理能力,而对分类或摘要任务使用本地小模型。要做到这种灵活切换,你需要一个在模型之上的抽象层。"

推理能力瓶颈:模型进步的真实图景

关于模型能力的进步速度,Dust 团队持有一种值得关注的审慎观点。Stanislas 指出,过去两年模型在上下文长度、音频和图像支持等外围能力上进步明显,但在"改变世界所需的核心能力"——推理能力(reasoning capabilities)上,实际上是基本持平的。

"GPT-4 的内部训练在大概两年前就完成了,过去两年推理能力层面没有实质突破。"虽然 Kevin Scott(微软 CTO)认为存在指数级进步但只是采样频率不够密导致观察偏差,但 Stanislas 承认他的实际体验是"没有像我最乐观预期那样快速发展"。

另一个可能的原因是基础设施瓶颈:训练下一代码所需的 GPU 集群规模巨大,当 GPU 数量扩展到那个级别时,故障几乎每时每刻都在发生,而训练是高度同步的。"可能只是需要时间学会如何从一台大计算机变成五台大计算机——这种学习曲线本身就是瓶颈。"

数学:解锁推理能力的钥匙

Stanislas 在 OpenAI 期间的核心研究方向是数学与 AI 的交叉,他至今仍然坚信数学——特别是形式化数学(formal mathematics)——是研究推理能力的关键环境。

"数学给了你完美的验证器——你可以精确判断模型的预测是对是错,而不需要人类来检查。这种能力是解锁推理突破的关键。"他和当时在 FAIR 工作的 Guillaume Lample(后来创立了 Mistral)有着相近的研究动机。"我仍然极度看好数学、形式化数学和 LLM 结合的研究方向。"

他的逻辑链条是:数学 → 软件 → 一切其他领域。如果 AI 能够精通形式化数学定理的证明,它就能通往更通用的推理能力。

"先有 PMF,再谈 GPU"——Dust 的产品哲学

在 2023 年,当很多公司争相训练自己的模型时,Dust 内部有一句口号:"No GPUs before PMF"(在找到产品市场匹配之前,不碰 GPU)。

Gabriel 解释说,决定不训练自有模型有两个原因。"首先,训练前沿模型需要极大的资金和承担极大风险——对我们来说,用更便宜的方式探索和验证哪些用例最能产生价值和参与度是更明智的选择。其次,训练数据的截止日期问题——你无法让前沿模型理解上周在你公司内部发生的事情,这意味着微调不是解决企业数据问题的正确方式。"

与其微调模型,不如采用 RAG(检索增强生成)范式——从文档中提取小段上下文,将其输入到模型中以增强工作流。"事实上,许多决策只需要有限的上下文信息就能大幅改善——即使上下文窗口当时还很小,也已经兼容了很多场景。"

用户比你更懂他们需要什么:单个助手 vs 专用代理的分布式智慧

Dust 最重要的洞察之一是关于"专业化"的。"人们实际上非常擅长分辨他们需要工具箱里的哪个工具——螺丝刀还是锤子。"Gabriel 说,"我们不恰当地不尊重用户——认为需要一个能完成一切的单一 Oracle。但当人们想工作时,发现手里拿到的是锤子而不是螺丝刀,他们会非常失望。"

正是这个洞察让 Dust 决定不将模型的选择和路由完全抽象化。"暴露给用户恰到好处的技术模块,给他们更多自主权——结果是我们看到了许多我们根本无法想象的用例。"

Dust 在企业内部的采用模式呈现出一种令人着迷的规律:首先在一两个明确的用例上部署,然后横向扩展到另一个用例,使用量保持平稳但缓慢增长,最终达到临界质量后猛然爆发——覆盖约 70% 的员工,每个员工创建自己的助手。

"到那时,最初由利益相关者确定的那些用例只占全部使用量的一小部分。"Stanislas 说,"这就是 Dust 提供最大价值的地方——我们甚至无法列举出所有发生的事情。"

"热力图":Dust 如何发现有潜力的人才

Gabriel 分享了一个有趣的观察:Dust 就像一个"热力图"(heat map),能够识别公司内部最有潜力和才华的人。

"在公司内部,那些使用 Dust 最多的人是那些最自在地说'我不害怕有些东西会把我工作中无聊和重复的部分夺走——我很兴奋这些东西会消失,这样我就能专注于高价值任务'的人。这些人是探索者、迭代者、测试新事物的人——这正是高绩效和高潜力的预示。"

这种模式在不同公司反复出现。Gabriel 认为这是从确定性技术(计算器——按同样的键得到同样的结果)向随机性技术(同样的提示可能得到略有不同的输出)的根本转变的一部分。"这是自计算机诞生以来最大的工具使用范式转变,"Stanislas 说,"我们要求整个劳动力群体转向随机性思维——而实现这一转变的唯一途径,是让人们体验到足够舒适的风险回报比。"

实际用例:从销售赋能到跨国合规审查

Dust 的用例范围极其广泛。最明显的是销售、支持和营销团队的赋能——本质上就是上下文检索和内容生成:回答工单、理解客户所在行业并起草邮件、生成博客文章。

但更令人兴奋的是跨职能用例——打破数据孤岛。一个不会编程的营销人员可以建立一个助手,用自然语言理解代码库中最近的合并请求(pull request)做了什么。一个工程师不需要 PM 的摘要,就能从销售电话录音中提取技术洞察。

Gabriel 分享了一个特别精彩的案例:一家公司在拓展新国家市场时决定不派驻全职团队。他们用 Dust 构建了一个助手,能够在陌生语言中审查网站、比对当地注册文件、执行政策检查——部署三周后就为三名人类代理人提供辅助。CTO 反馈说:"我们每个月节省了超过 600 小时。"

"这个用例不可能通过垂直化的销售动议来探索或发现——你怎么可能找到那个国家团队中一个相对初级的成员,并向他们推销呢?"但如果有一个通用基础设施,人们可以自己玩、自己探索——奇迹就会发生。

企业部署的挑战:安全、权限与新旧世界交织

Gabriel 描述了企业部署 AI 时面临的独特挑战。"安全性需要从阻碍者转变为支持者——你需要一个从顶层鼓励探索的领导者。其次,权限控制变得非常微妙——在 2020 年,你问'我能不能访问这个文件?'答案是 '是' 或 '否'。在 2024 年,你问的是'我的助手能不能访问这个文件,然后给我一个摘要——但摘要应该去掉我无权看到的关键信息,同时保留我需要做出决策的信息点?'这组细粒度的权限原语在现有文档系统中基本不存在。"

这正体现了 Dust 的核心信念:应用层非常厚——产品逻辑、可用性、性能保障、用户采用——这些都是真正需要解决的问题,而不是简单地等待下一个更好的模型。

从计算器到随机性:2025 及更远的未来

当被问到 Dust 的核心信念时,Stanislas 的回答展现了对产品本质的深刻思考:"我真正相信,我们只是刚刚触及了这些模型能力的表面。我们从对话界面开始——所以你现在用 Slack 的类比来理解 Dust。但我真的相信 Slack 的体验不会持久——因为我们与这项技术的交互方式将会改变。这些模型本质上是计算机的 CPU,API 和 Token 是现代版的 Bash 接口。我们现在做的,仅仅是发明 Bash 脚本。"

他暗示着一种更根本的变革:未来与 AI 的交互将不再局限于对话界面——它将变得更加原生、更加无缝、更加嵌入到工作本身之中。