Box CEO 谈 AI 采纳鸿沟:为什么硅谷低估了企业 AI 扩散的时间
摘要
在本期 a16z 播客中,Box CEO Aaron Levie 与 a16z 合伙人就 AI 智能体(Agent)在企业中的采纳速度展开了深度讨论。核心论点是:AI 能力的真正扩散将比硅谷预期慢得多,原因在于企业面临着初创公司无需面对的复杂挑战——安全治理、遗留系统集成、访问控制以及组织惯性。讨论涵盖了算法思维的门槛、智能体作为新抽象层的演进、软件架构从"为人设计"到"为智能体设计"的根本翻转、SAP 等企业级系统为何不会轻易被替代、智能体治理中的安全风险,以及工程计算预算(Engineering Compute Budget)带来的全新经济学问题。多位嘉宾通过历史类比——从电子表格的普及到开源规范的建立、从 PC 与云计算的消费爆炸到真空管到晶体管的跃迁——论证了当前的混乱只是过渡期,最终将迎来属于 AI 的"晶体管时刻"。
正文
一、AI 能力扩散的速度之争
讨论以一句断言开场:"AI 能力的扩散将比硅谷意识到的更慢。"这个判断并非出于技术悲观主义,而是基于一个根本性的观察:初创公司可以从零开始构建,没有需要"炸毁"的遗留系统(Legacy System),因而能够全速拥抱智能体(Agent)和 AI 驱动的自动化。但当你走进摩根大通(JP Morgan)这样的巨型企业,问他们如何用 NanoClaw 来自动化业务流程时,答案就变得极为复杂。
硅谷的乐观叙事往往源自对初创公司速度的观察——这些公司没有安全债务、没有合规负担、没有需要维护的 75 个异构系统的集成问题。但企业现实是另一回事:首席信息官(CIO)和首席财务官(CFO)们面对的是数十年来积累的系统、数据孤岛和各业务线的权力边界。这种"大公司与小公司之间的分裂"(Split between Big and Small)正在形成一种有趣的张力——个体开发者和初创公司正在以前所未有的速度前行,而企业客户则在焦虑中谨慎观望,二者的差距正在急剧扩大。
二、算法思维的鸿沟:为什么大多数人无法真正使用智能体
嘉宾们指出了一个被广泛忽视的问题:算法思维(Algorithmic Thinking)对绝大多数职场人士来说极为困难。如果你走进任何组织,随便找一个人,要求他们为自己日常工作画一张流程图(Flowchart),"他们大概率会失败"。在一个 50 人的市场营销团队中,也许只有一个人真正理解整个工作流程并能够将其文档化。
这意味着,当我们将智能体或协同工作工具(Co-working Tool)放到人们面前时,他们向智能体解释"该做什么"的能力是非常有限的。算法思维是一种稀缺技能——它要求将模糊的、直觉驱动的日常决策转化为结构化的、可编程的逻辑链。这正是 Anthropic 增长营销人员(Anthropic Growth Marketer)那个走红案例的关键所在:那个人之所以能用 Claude Code 自动化五到十个人的工作,不是因为他会"用 AI",而是因为他本身就是一个系统思考者(Systems Thinker),具备足够的工程思维来设计和编排多个智能体的协作。
但这并不意味着智能体只属于精英。"火箭科学的部分会在很短的时间内蒸发掉"——就像电子表格(Spreadsheet)最初需要一整间屋子的实习生来操作,而几年后每个银行经理都变成了"电子表格人"一样,智能体的使用门槛将迅速降低。当技术成熟后,剩下的核心差异化因素将是领域知识(Domain Expertise),而非操作技巧。
三、智能体作为新的抽象层:从电子表格到 AI
一位嘉宾用他表姐的故事生动地说明了这一历史规律:她 MBA 毕业后进入银行工作时,恰好处于计算技术普及的临界点——她不会用电子表格,于是公司让她"想雇多少实习生就雇多少",一整间屋子的大学生帮她做表格。但短短几年后,她和她那一整批人都成了电子表格高手。旧的抽象层(手工计算器 + 实习生)被新的抽象层(电子表格 + 个人直接操作)所取代。
智能体正在经历完全相同的过程。目前,你觉得自己需要 50 个智能体、一个超级聪明的人来协调它们、把工作拆成极小的碎片——"但很快,那整个东西就会坍缩成一个技能集、一段代码、或者说一个'有点营销意味'的智能体,你能直接问它营销问题,它就能去执行"。关键在于,智能体将不仅是工具,而是一层新的抽象——它会改变人们与技术交互的方式,并在组织内部重新定义工作的边界。
四、软件必须为智能体而建:数量级的翻转
讨论中提出了一个在当下语境中极为深远的前提:如果智能体的数量是人类的百倍甚至千倍,那么软件必须为智能体而建,而不仅仅是为人而建。这意味着软件架构的根本性翻转——过去三十年,我们一直在构建图形用户界面(GUI);未来,我们同样需要为智能体构建一等公民的交互界面。
Box 团队已经在实践中验证了这一方向:他们现在花在思考工具的"智能体接口"(Agent Interface)上的时间和花在人类界面上的一样多。他们的假设很明确——当你拥有比人类多百倍千倍的智能体在使用你的系统时,你的商业表现将直接与你对智能体的友好程度挂钩。一个好的智能体接口可以是 API、CLI(命令行界面)或者 MCP(Model Context Protocol,模型上下文协议)——智能体可以在各种范式之间自由切换,有时使用现有工具,有时直接编写代码来解决问题,这种灵活性本身就成为了一种"超能力"。
Box CLI 的发布是一个具体案例。将 Box CLI 交给 Claude Code,用户就可以用自然语言与整个 Box 系统交互——上传文件夹、批量处理文档,一切都在自然语言指令下完成。但当场景从个人使用扩展到 5000 名员工(及其智能体)共享同一个知识库时,全新的挑战出现了:如何协调成千上万次的系统访问?如何防止一个智能体在另一个智能体正在写入时移动文件?这不再是性能问题,而是一个并发治理(Concurrency Governance)问题——"这将变成每个 CFO 和 CIO 火烧眉毛般去解决的新课题"。
五、企业系统的堡垒:SAP 和领域知识不会消失
在硅谷,有一种流行的叙事是"AI 将取代一切遗留系统"——埃隆·马斯克(Elon Musk)甚至说过未来将是"从提示词(Prompt)直接到机器码"。但嘉宾们认为这严重低估了企业软件的复杂性。以 SAP 为例:"认为你可以用 Vibe Coding(氛围编程)搞出一个 SAP,这简直荒谬。"SAP 中蕴含的领域知识,并不只是存储在一个组织良好的数据层中——它嵌入在 UI 里、中间层里、甚至在使用方式本身中。几十年的业务流程逻辑、法规遵从、行业特殊性,这些不是简单的数据迁移问题。
但这并不意味着现有软件厂商可以高枕无忧。真正的问题在于:当智能体需要访问 SAP 或 Workday 中的数据来执行日常操作时,这些系统能否提供足够的 API 访问能力?传统的 SaaS 供应商卖的是"智能和领域专业能力",而智能体想要的只是数据本身。这是一个长期存在的张力——SAP 和 Workday 们从未真正将"无限数据访问"作为商业模式,而智能体恰好需要这种能力。
一个更有趣的视角是:软件的历史始终是层层叠加(Layering)的历史,而非层叠消失的历史。马斯克的"提示词到机器码"是一种"层叠坍缩"的观点;但另一个更有历史依据的观点是:"层从不消失,它们只是被新的层覆盖。"组织边界、合规要求、兼容性需求——这些因素确保了现有架构不可能在一夜之间被替代。"SAP 不会消失,所以 AI 在这一特定数据源上的扩散会被减速,无论这是智能体化 AI 在执行操作,还是只读 AI 在做报表。"
六、安全与治理:智能体的"影子 IT"风险
当讨论深入到智能体在企业中的安全治理时,气氛明显紧张起来。一位嘉宾分享了他在一群 CFO 和 CIO 面前提出"智能体将极大简化系统集成"这一观点后的遭遇——"六个 CFO 冲上来说:'你疯了,你的可信度在我这里归零。'"
他们担心的不是智能体本身,而是将集成能力下放到普通人手中后可能引发的灾难。"你让人们去创建新集成,就等于在说'请把我的核心记录系统(System of Record)搞崩'。"即使只是生成报表,一个人想要做出错误的报表那是他自己的事——但如果是向核心系统写入数据呢?"我认为我们会在相当长的年份里只拥有'只读'版本的这一切。"
更深层的问题是智能体的安全向量与传统人类安全完全不同。智能体可以被提示注入(Prompt Injection)攻击——因为模型无法可靠地"保守秘密",任何进入上下文窗口(Context Window)的信息理论上都可以被社会工程手段诱导出来。攻击者可以用远低于欺骗人类的成本来欺骗一个智能体,而这个智能体可能恰好有权访问公司的并购文件。
嘉宾们将当前阶段类比为开源软件(Open Source)在企业中的早期阶段:最初没有人争论——你可以随意复制开源代码到商业产品中。然后所有人迅速发现了许可、质量、安全等一系列问题,规范和标准随之出现。"同样的辩论正在发生,只是这次发生在 X(Twitter)和播客上,而开源时代的这些辩论只发生在一个小会议室里。"
嘉宾提出了两种最终状态的可能性:一种认为智能体最终将收敛到与人类同等的可靠性水平,届时我们可以使用对待人类相同的机制——内部威胁防护、操作流程、权限管理;另一种认为智能体的威胁向量将"比人类复杂得多",因此企业客户会在相当长一段时间内"关闭一切",直到出现某种秩序。在此期间,个体开发者和初创公司将以巨大优势领先——这种张力"可能是最令人兴奋的矛盾"。
七、别只建 API——建智能体真正想要的东西
保罗·格雷厄姆(Paul Graham)最近提出了"Build Something Agents Want"(构建智能体想要的东西)的理念,引发了讨论中一个精妙的转折点。主流观点认为这意味着为智能体构建优秀的 API 和接口定义语言(IDL)。但一位嘉宾提出了完全相反的看法:"我认为这几乎就是说反了。"
他的论点是:智能体实际上非常擅长选择正确的技术——它们不关心界面的美观,它们关心的是语义(Semantics)、成本参数(Cost)、持久性(Durability)和实际的系统质量。"每当我让一个智能体在多个云平台之间做选择时,它使用的都是真正有意义的标准,而不是界面标准。"这意味着行业过度关注了"向智能体营销"这件事,而真正重要的实际上是构建更好的系统——智能体会基于实际的技术优势做出自然选择。
但 Box CEO 补充了一个关键角度:这不是营销问题,而是开放性问题。"如果你的工具对智能体封闭,智能体最终会为那家公司找到更好的替代工具。"他描绘了一个未来场景——过去企业依靠高德纳(Gartner)等分析机构来指导技术采购决策;未来,"在足够多次迭代之后,智能体会直接告诉你应该使用哪种数据库来完成某类操作。如果你不在那个选择集合里,你就会被淘汰(DOA,Dead on Arrival)。"
这种"智能体作为技术采购者"的角色将创造一个巨大的正向循环:智能体越多,对智能体友好的工具越有市场;越有市场,越多的软件会向智能体开放。而在此过程中,智能体甚至可能自发地创建"事实上的新记录系统"——"它们会把 IT 部门认为只是'最终用户垃圾区'的某些中间件区域彻底碎片化。"
八、工程计算预算:被严重低估的经济学机会
讨论的最精彩部分之一是关于 AI 经济学(AI Economics)的辩论。嘉宾们认为,当前华尔街对 AI 的经济模型存在根本性错误——"每个人都在试图搞清楚这一切的经济学,但他们对机会规模的估计至少差了一个数量级。"
核心谬误是零和思维(Zero-sum Thinking)。华尔街分析师将 AI 的收入想象为一个固定大小的蛋糕——就像当年人们认为 PC 的市场仅限于已有的大型机 MIPS(每秒百万指令)总量,认为云计算只是把 6 万台服务器的市场搬到别人的数据中心,而不是意识到计算资源的使用将爆炸式增长千倍。"那些金融模型有着固定的收入饼图——这正是让我发疯的事情。"
真实的情况是:正如同 Salesforce 将 CRM 市场从一个 20 亿美元的痛苦采购变成了每个销售人员都可以零摩擦注册使用的服务,AI 将创造全新的消费场景和商业模式。嘉宾以自身投资组合为证——他在过去六个月中看到 240 家基础设施公司中的每一家都出现了爆发式增长(Asymptotic Growth),"不是因为它们有了企业客户,而是因为现在正在编写的软件比历史上任何时候都多。"
工程计算预算(Engineering Compute Budget)将成为未来几年最激烈的辩论话题。当前一家上市科技公司的研发支出通常占营收的 14% 到 30%。如果 Token 计算成本达到工程团队成本的 2 倍,还是仅仅增加 3%,这将直接影响公司的每股收益(EPS)。但同时,让人纠结的地方在于:你希望你的工程师因为担心 Token 成本而不敢尝试吗?"比如我现在觉得我们应该浪费很多 Token,因为这意味着我们在尝试新东西。"
在短期内,这种张力是真实的——"在录制本节目的当下,人们正因为 Claude Code Max 计划被用完额度而抓狂,三条提示词之后就被封了。"但从长期来看,嘉宾认为这一切都会过去。理由很简单:如果你为一个工程师支付 X 美元的年薪,那么让这个工程师效率提升 10 倍的工具几乎必然是合理的投资。最终,"晶体管时刻"的到来——无论是通过供给增加、算法突破还是硬件革新——将彻底改变当前的成本方程式。
九、从历史中寻找信心:每一次技术革命都经历过此刻
讨论以一系列强有力的历史类比收束。云计算兴起时,CFO 们曾坐在简报中心里说:"你不理解,我们是一家农业公司,我们只知道资本支出(CAPEX)。"几年后,同样的公司说:"我们爱云计算,因为一切都转向了运营支出(OPEX)。"会计的规则最终会适应,就像它们适应了每一次技术变革。
IBM 的大型机(Mainframe)时代,所有人都以 MIPS 来定价和思考,直到有人指出一个尴尬的事实——IBM 每年在卖出越来越多的 MIPS,但每 MIPS 的价格在不断下降,因为他们制造 MIPS 的速度比收费的速度还快。"同样的事情保证会发生。你可以用最强硬的方式说这话。"
从电子表格让一整间屋子的实习生消失,到开源软件从"随便复制"发展到严密的许可证治理体系,再到个人电脑和云计算让计算消费从千级跃升至百万级——每一次技术革命都经历了同样的弧线:混乱的过渡期、恐惧驱动的保守主义、最终是新的常态和更大的市场。"真空管到晶体管"的类比提供了最终的乐观基调——我们现在面对的限制(Token 成本、算力瓶颈、不可复现性)可能只是一次"晶体管时刻"前的阵痛。
十、结语
本期讨论之所以有价值,在于它没有陷入硅谷常见的"技术乌托邦"或"AI 末日论"的任何一端。嘉宾们反复在乐观的长期判断和清醒的短期现实主义之间切换:他们相信智能体将从根本上重塑软件架构和工作方式,但同时也承认当前的技术——不可复现性(Non-reproducibility)、安全漏洞、组织惯性——意味着真正的变革需要数年甚至数十年。
"你基本上是在回到 Thanksgiving 晚餐时的对话——你已经在用电子表格了,你的表姐还在挣扎——而你忍不住想说'为什么这这么难?你应该直接用电子表格'。然后两年后,她就会了。"这就是我们当前所处的时刻。火箭科学的部分正在蒸发,剩下的将是领域知识的战争。而那些能够同时构建面向人类和智能体的双重界面的公司,将成为这个新时代的定义者。