AI生态的开源之路——对话Mistral AI创始人Arthur Mensch与Sequoia合伙人Matt Miller

cover Sequoia Capital · 2024-03-26🎬 在 YouTube 观看原视频 →>

摘要

在Sequoia AI Ascent 2024大会的开幕对话中，Mistral AI创始人兼CEO Arthur Mensch与Sequoia合伙人Matt Miller展开了一场关于开源AI生态系统的深度对话。这家成立仅九个月的法国AI公司，以远少于竞争对手的资源和极为精简的团队，发布了逼近GPT-4水平的开源模型，震惊了整个行业。Mensch从DeepMind研究员到创业者的转型故事，揭示了驱动Mistral诞生的核心理念：2022年之后，封闭的AI研究文化是对整个领域进步的伤害，而开源是恢复这一进步势头的唯一解药。

对话覆盖了开源商业模式的核心挑战——如何在为社区持续贡献与构建可持续商业之间取得平衡。Mensch坦陈这一"动态张力"的存在：保持开源领导地位需要持续投入，而AI发展的速度远超传统软件，要求公司以更快的节奏演进。他阐述了大模型（Large Model）与小模型（Small Model）的协同策略——"一尺寸不通吃"是每位LLM服务提供商的共识，高效应用需将大模型作为小模型的"编排器"。

作为欧洲AI的代表性力量，Mensch分享了在法国创业的独特优势：丰富的顶尖初级人才池、远低于硅谷的工程师成本（"十倍以下的成本培养出同等产能的工程师"）、以及欧洲市场对多语言模型的本土化需求。在可预见的未来，Mistral赌注的是AI基础设施将走向开放——一个独立于云服务商、以开源为核心价值的平台，最终让每个普通用户都能自主创建AI助手（Assistant）和自主智能体（Autonomous Agent）。

正文

一、闭源时代的反叛：Mistral的创立初心

Mistral的故事始于一种"学术的惋惜"。Mensch与联合创始人Timothée Lacroix和Guillaume Lample早在学生时代就已相识，在AI领域深耕逾十年。他们见证并热爱着AI进步的关键机制——学术实验室与工业实验室之间的开放交流，各方在彼此工作的基础上持续攀登。直至2022年，这一机制戛然而止。

转折点是Chinchilla论文。 2022年，DeepMind发布的Chinchilla论文成为Google对外公布的最后一份重要模型研究。此后，前沿AI研究的大门缓缓关闭。对于Mensch这样的研究者而言，这在AI之旅的初期就停止开放贡献，是一种深层的遗憾——"我们离完成AI还差得远。"

当ChatGPT在2022年底横空出世时，Mensch看到的不仅是技术震撼，更是一种"可以做不同事情"的可能性：在法国，有大量在大科技公司中感到倦怠的顶尖人才等待召唤；以一只精益团队、极快速度构建强大的开源模型，或许是纠正行业方向的机会。Mistral的使命由此诞生：让AI进入每一位开发者的手中——这正是竞争对手仍在以闭源方式所做的事情的反面。

二、开源与商业的永恒张力

任何开源软件公司都会面对的核心矛盾在Mistral这里以加速版上演。Mensch的策略是双模型家族——开源模型与商业模型并行，但这一格局随时可能演变。保持开源领导地位本身就是压力源，因为竞争者环伺，Mistral必须在速度上持续领跑。

"AI的发展速度比软件更快，比数据库更快，"Mensch指出。MongoDB在开源数据库领域的策略虽是绝佳参照，但Mistral需要更快的适应节奏。每一周，团队都在重新评估：下一个应该在哪一个模型家族中发布什么？这种不断重新校准的动态决策，是开源AI公司特有的生存状态。

Mistral的效率优势源于一种被Mensch称为"愿意弄脏手"的工程文化。机器学习从来不只是优雅的算法——它关乎大量的提取、转换、加载（ETL）工作，以及那些往往并不迷人的数据处理细节。Mistral雇用的是愿意深入这些"苦活"的人，这构成了其速度与效率的根基。

三、一大一小：模型家族的协同哲学

"一尺寸不通吃"是Mensch从实践中领悟的关键洞察。不同的应用场景需要不同的LLM调用策略：

低延迟场景（如实时客户支持）不需要顶级推理能力，小模型以速度取胜
高智能需求场景（如复杂代码生成、宏观经济分析）需要大模型的全量能力
高效应用应将大模型作为小模型的"编排器"——大模型负责任务分解与调度，小模型负责快速执行

但挑战随之而来：如何确保这个多模型系统的一致性？ 当你在系统中部署两个模型外加一个外部调用循环时，如何进行恰当的评估？如何实现持续集成（Continuous Integration）？如何从一个模型版本切换到另一个，确保应用整体性能是上升而非退化？Mensch认为，解决这些开发者体验层面的问题，将是Mistral核心价值主张的一部分。

四、生态赋能：社区中正在发生什么

使用Mistral模型的场景已经遍地开花。在硅谷，几乎每一家年轻的创业公司都在使用Mistral进行微调和快速应用构建。"Mixtral模型特别快，"Mensch强调，"因此可以构建更具深度的应用。"应用场景涵盖广泛：

搜索引擎公司在使用Mistral
标准企业场景——知识管理、营销
由于可获取模型权重，企业可以将自身的编辑风格注入模型

开源赋予开发者的"控制权"是核心价值：可以在任何地方部署，可以通过专属实例确保高服务质量，可以修改权重以匹配自身需求——将性能提升至接近最大模型水平，同时成本大幅降低。

五、欧洲创业的独特禀赋

Mensch坦率地描绘了在欧洲、尤其在法国构建AI公司的优劣势图谱：

优势侧：
- 一流初级人才池：法国、波兰、英国高校输出大量机器学习硕士生，经过三个月训练可达到百万美元年薪硅谷工程师的同等产出——成本仅为其十分之一
- 政府支持：欧洲政府比美国更积极介入
- 欧洲客户的地缘偏好：欧洲企业更愿意与欧洲AI公司合作
- 多语言优势：Mistral Large是目前最强的法语模型

劣势侧：
- 欧洲政府"倾向于过快地过度监管"——Mensch及其团队一直在游说但并非总被听从

这种欧洲定位也塑造了Mistral独特的产品路线：多语言数据、多语言模型是核心投资方向——这既是对欧洲客户需求的回应，也是差异化竞争的天然壁垒。

六、五年愿景：AI基础设施走向开放

"五年后是什么样的——我真的没有概念，"Mensch坦诚，"如果回到2019年，你也无法预测今天的局面。"但他押注于一个根本性判断：AI的基础设施和平台将是开放的。

在这条开放路径上逐级递进的愿景是：
1. 打造最开放的AI开发平台——独立于云服务商
2. 从助手到自主智能体——AI将完成越来越多、越来越复杂的任务
3. 从开发者到用户的无缝过渡——由于AI天然接受人类语言控制，开发者与用户的边界将逐渐消融
4. 学校教育的一部分——五年后，创建自己的AI助手或自主智能体将是学校教授的基本技能

七、开源与商业的博弈论

当被问及未来开源与商业模型的演化时，Mensch勾勒出一个受博弈论驱动的动态："如果所有人都开始完全开放，我们也可以。"但当前的竞争格局不允许率先冒险。这意味着Mistral的开放线是流动的——由行业领头羊的行为、竞争压力和商业可行性共同校准。

对于Llama 3等竞争者，Mensch表现出开源特有的豁达："开源的好处在于，竞争从来不会太激烈——多方参与实际上对所有人都有利。如果Meta的模型真的非常强大，我们欢迎这种协同。"他同时质疑Llama 3是否真正会完全开源。

八、数据引力：为什么与Snowflake和Databricks合作

Mistral与Snowflake、Databricks的深度合作并非偶然。Mensch指出一个根本趋势：AI模型如果连接到数据，就会变得异常强大。而企业的数据恰好大量沉淀在Snowflake或Databricks平台上。将AI部署在数据所在之处，是企业客户的天然需求。

更深层的逻辑是：AI部署正在从无状态（Stateless）走向有状态（Stateful）。当前的服务端API部署如同Lambda函数般无状态，但随着模型越来越专业化、越来越为特定用例调优、越来越具备自我改进能力，AI将需要管理状态。——"AI状态放在哪里？"这是一个尚待解答的开放问题，而Snowflake和Databricks显然希望它落在自己的数据云上。

九、给创业者的建议：永远第一天

对话尾声，Mensch以"永远第一天（It's always day one）"总结自己的创始人心得。尽管Mistral已经获得了显著的心智份额，但仍有无数证明点需要建立。"做创始人意味着每天醒来，意识到你需要从头构建一切，每次都是如此。这有点让人筋疲力尽，但同时也令人振奋。"

他的建议简洁有力：志存高远。 "野心可以带你走很远——你应该做大梦。"这不仅是对创业者的勉励，也是Mistral自身基因的写照：一只来自巴黎的精干团队，以开源为武器，在AI基础设施的宏大叙事中写下属于欧洲的一章。