AI生态的开源之路——对话Mistral AI创始人Arthur Mensch与Sequoia合伙人Matt Miller

摘要
在Sequoia AI Ascent 2024大会的开幕对话中,Mistral AI创始人兼CEO Arthur Mensch与Sequoia合伙人Matt Miller展开了一场关于开源AI生态系统的深度对话。这家成立仅九个月的法国AI公司,以远少于竞争对手的资源和极为精简的团队,发布了逼近GPT-4水平的开源模型,震惊了整个行业。Mensch从DeepMind研究员到创业者的转型故事,揭示了驱动Mistral诞生的核心理念:2022年之后,封闭的AI研究文化是对整个领域进步的伤害,而开源是恢复这一进步势头的唯一解药。
对话覆盖了开源商业模式的核心挑战——如何在为社区持续贡献与构建可持续商业之间取得平衡。Mensch坦陈这一"动态张力"的存在:保持开源领导地位需要持续投入,而AI发展的速度远超传统软件,要求公司以更快的节奏演进。他阐述了大模型(Large Model)与小模型(Small Model)的协同策略——"一尺寸不通吃"是每位LLM服务提供商的共识,高效应用需将大模型作为小模型的"编排器"。
作为欧洲AI的代表性力量,Mensch分享了在法国创业的独特优势:丰富的顶尖初级人才池、远低于硅谷的工程师成本("十倍以下的成本培养出同等产能的工程师")、以及欧洲市场对多语言模型的本土化需求。在可预见的未来,Mistral赌注的是AI基础设施将走向开放——一个独立于云服务商、以开源为核心价值的平台,最终让每个普通用户都能自主创建AI助手(Assistant)和自主智能体(Autonomous Agent)。
正文
一、闭源时代的反叛:Mistral的创立初心
Mistral的故事始于一种"学术的惋惜"。Mensch与联合创始人Timothée Lacroix和Guillaume Lample早在学生时代就已相识,在AI领域深耕逾十年。他们见证并热爱着AI进步的关键机制——学术实验室与工业实验室之间的开放交流,各方在彼此工作的基础上持续攀登。直至2022年,这一机制戛然而止。
转折点是Chinchilla论文。 2022年,DeepMind发布的Chinchilla论文成为Google对外公布的最后一份重要模型研究。此后,前沿AI研究的大门缓缓关闭。对于Mensch这样的研究者而言,这在AI之旅的初期就停止开放贡献,是一种深层的遗憾——"我们离完成AI还差得远。"
当ChatGPT在2022年底横空出世时,Mensch看到的不仅是技术震撼,更是一种"可以做不同事情"的可能性:在法国,有大量在大科技公司中感到倦怠的顶尖人才等待召唤;以一只精益团队、极快速度构建强大的开源模型,或许是纠正行业方向的机会。Mistral的使命由此诞生:让AI进入每一位开发者的手中——这正是竞争对手仍在以闭源方式所做的事情的反面。
二、开源与商业的永恒张力
任何开源软件公司都会面对的核心矛盾在Mistral这里以加速版上演。Mensch的策略是双模型家族——开源模型与商业模型并行,但这一格局随时可能演变。保持开源领导地位本身就是压力源,因为竞争者环伺,Mistral必须在速度上持续领跑。
"AI的发展速度比软件更快,比数据库更快,"Mensch指出。MongoDB在开源数据库领域的策略虽是绝佳参照,但Mistral需要更快的适应节奏。每一周,团队都在重新评估:下一个应该在哪一个模型家族中发布什么?这种不断重新校准的动态决策,是开源AI公司特有的生存状态。
Mistral的效率优势源于一种被Mensch称为"愿意弄脏手"的工程文化。机器学习从来不只是优雅的算法——它关乎大量的提取、转换、加载(ETL)工作,以及那些往往并不迷人的数据处理细节。Mistral雇用的是愿意深入这些"苦活"的人,这构成了其速度与效率的根基。
三、一大一小:模型家族的协同哲学
"一尺寸不通吃"是Mensch从实践中领悟的关键洞察。不同的应用场景需要不同的LLM调用策略:
- 低延迟场景(如实时客户支持)不需要顶级推理能力,小模型以速度取胜
- 高智能需求场景(如复杂代码生成、宏观经济分析)需要大模型的全量能力
- 高效应用应将大模型作为小模型的"编排器"——大模型负责任务分解与调度,小模型负责快速执行
但挑战随之而来:如何确保这个多模型系统的一致性? 当你在系统中部署两个模型外加一个外部调用循环时,如何进行恰当的评估?如何实现持续集成(Continuous Integration)?如何从一个模型版本切换到另一个,确保应用整体性能是上升而非退化?Mensch认为,解决这些开发者体验层面的问题,将是Mistral核心价值主张的一部分。
四、生态赋能:社区中正在发生什么
使用Mistral模型的场景已经遍地开花。在硅谷,几乎每一家年轻的创业公司都在使用Mistral进行微调和快速应用构建。"Mixtral模型特别快,"Mensch强调,"因此可以构建更具深度的应用。"应用场景涵盖广泛:
- 搜索引擎公司在使用Mistral
- 标准企业场景——知识管理、营销
- 由于可获取模型权重,企业可以将自身的编辑风格注入模型
开源赋予开发者的"控制权"是核心价值:可以在任何地方部署,可以通过专属实例确保高服务质量,可以修改权重以匹配自身需求——将性能提升至接近最大模型水平,同时成本大幅降低。
五、欧洲创业的独特禀赋
Mensch坦率地描绘了在欧洲、尤其在法国构建AI公司的优劣势图谱:
优势侧:
- 一流初级人才池:法国、波兰、英国高校输出大量机器学习硕士生,经过三个月训练可达到百万美元年薪硅谷工程师的同等产出——成本仅为其十分之一
- 政府支持:欧洲政府比美国更积极介入
- 欧洲客户的地缘偏好:欧洲企业更愿意与欧洲AI公司合作
- 多语言优势:Mistral Large是目前最强的法语模型
劣势侧:
- 欧洲政府"倾向于过快地过度监管"——Mensch及其团队一直在游说但并非总被听从
这种欧洲定位也塑造了Mistral独特的产品路线:多语言数据、多语言模型是核心投资方向——这既是对欧洲客户需求的回应,也是差异化竞争的天然壁垒。
六、五年愿景:AI基础设施走向开放
"五年后是什么样的——我真的没有概念,"Mensch坦诚,"如果回到2019年,你也无法预测今天的局面。"但他押注于一个根本性判断:AI的基础设施和平台将是开放的。
在这条开放路径上逐级递进的愿景是:
1. 打造最开放的AI开发平台——独立于云服务商
2. 从助手到自主智能体——AI将完成越来越多、越来越复杂的任务
3. 从开发者到用户的无缝过渡——由于AI天然接受人类语言控制,开发者与用户的边界将逐渐消融
4. 学校教育的一部分——五年后,创建自己的AI助手或自主智能体将是学校教授的基本技能
七、开源与商业的博弈论
当被问及未来开源与商业模型的演化时,Mensch勾勒出一个受博弈论驱动的动态:"如果所有人都开始完全开放,我们也可以。"但当前的竞争格局不允许率先冒险。这意味着Mistral的开放线是流动的——由行业领头羊的行为、竞争压力和商业可行性共同校准。
对于Llama 3等竞争者,Mensch表现出开源特有的豁达:"开源的好处在于,竞争从来不会太激烈——多方参与实际上对所有人都有利。如果Meta的模型真的非常强大,我们欢迎这种协同。"他同时质疑Llama 3是否真正会完全开源。
八、数据引力:为什么与Snowflake和Databricks合作
Mistral与Snowflake、Databricks的深度合作并非偶然。Mensch指出一个根本趋势:AI模型如果连接到数据,就会变得异常强大。而企业的数据恰好大量沉淀在Snowflake或Databricks平台上。将AI部署在数据所在之处,是企业客户的天然需求。
更深层的逻辑是:AI部署正在从无状态(Stateless)走向有状态(Stateful)。当前的服务端API部署如同Lambda函数般无状态,但随着模型越来越专业化、越来越为特定用例调优、越来越具备自我改进能力,AI将需要管理状态。——"AI状态放在哪里?"这是一个尚待解答的开放问题,而Snowflake和Databricks显然希望它落在自己的数据云上。
九、给创业者的建议:永远第一天
对话尾声,Mensch以"永远第一天(It's always day one)"总结自己的创始人心得。尽管Mistral已经获得了显著的心智份额,但仍有无数证明点需要建立。"做创始人意味着每天醒来,意识到你需要从头构建一切,每次都是如此。这有点让人筋疲力尽,但同时也令人振奋。"
他的建议简洁有力:志存高远。 "野心可以带你走很远——你应该做大梦。"这不仅是对创业者的勉励,也是Mistral自身基因的写照:一只来自巴黎的精干团队,以开源为武器,在AI基础设施的宏大叙事中写下属于欧洲的一章。