a16z 百大 AI 应用报告深度解读:模型竞争、智能体爆发与全球 AI 格局

摘要

a16z 合伙人 Olivia Moore 在第六版 Top 100 AI 应用报告发布之际,对过去六个月的 AI 产业变革进行了全面梳理。在基础模型层面,ChatGPT 依然以压倒性优势领跑——网页端用户是 Gemini 的 2.7 倍、Claude 的 30 倍,但三者在战略定位上已出现明显分化:ChatGPT 以"全民 AI"为目标构建消费级应用商店,Claude 深耕专业用户(Prosumer)和高价值数据工具,Gemini 则凭借创意工具(Nano Banana 系列)找到了独特的增长引擎。报告首次纳入非 AI 原生但 AI 驱动的产品(如 Canva、Notion),并揭示了全球 AI 使用的惊人地域差异——新加坡人均使用率排名第一,美国仅列第 20 位,而中俄因政策限制各自形成了平行的 AI 生态。智能体(Agent)领域是本次报告的最大亮点:OpenClaw 和 Manus 的爆发式增长标志着 AI 正从被动问答转向主动执行,消费级智能体的时代已经到来。Olivia 还深入论述了上下文复利效应(compounding advantages)、AI 浏览器之争、语音交互崛起以及记忆(memory)作为核心壁垒的未来图景。

正文

一、三周年报告:变与不变

a16z 的 Top 100 AI 应用报告自 2023 年首次发布以来,已历经六个版本、跨越三年。Olivia 在节目开场便指出一个看似矛盾的现实:一方面,生成式 AI 的增长速度令人震撼;另一方面,整个行业依然处于极早期阶段。

以 ChatGPT 为例:它毫无疑问是全球最大的 AI 产品,但每周活跃用户仍只占全球人口的 10%。这意味着 AI 的主流化进程才刚刚开始,真正的爆发尚未到来。

回顾过去六个月,Olivia 认为有三个变化最具标志性。其一,消费级 AI 市场的争夺战全面升温——ChatGPT 之外,Gemini 和 Claude 都在各自的消费者和专业用户群体中加倍下注。其二,报告首次将非 AI 原生但现已以 AI 为核心驱动的产品纳入统计,如 Canva、Notion、Freepik。其中 Notion 宣布其新增年化收入(ARR)中有近一半来自 AI 优先功能,这成为传统 SaaS 向 AI 转型的一个标杆案例。其三,AI 的使用场景已不再局限于网页或应用内的一个对话框,而是渗透进了整个计算环境:AI 浏览器(Dia、Comet、Atlas)、桌面应用(Cursor、Whisper Flow、Granola),以及 Claude 内嵌于 Excel、PowerPoint 和 Chrome 的能力,共同构成了 AI 无处不在的新形态。

二、基础模型的三极分化

尽管 ChatGPT 在用户规模上仍然是无可争议的王者,三大基础模型之间的战略分化已十分清晰。

用数据说话:ChatGPT 在网页端是 Gemini 的 2.7 倍,移动端是 2.5 倍;与 Claude 相比差距更大——网页端近 30 倍,移动端近 80 倍。Olivia 还提及了 Sam Altman 在超级碗广告战期间发的那条著名推文:"ChatGPT 免费版在德克萨斯州的用户就比 Claude 全世界的用户都多。"

但数据并不能说明一切。Olivia 强调,用户正在同时使用多个产品,并根据不同需求选择不同工具,这种使用行为的"扩展"正在重塑市场份额。

在三者的战略定位上:

ChatGPT 的路线最接近"AI 时代的 Google":以最大规模获取消费者,然后通过广告、交易分成等多种方式变现。其应用目录(Apps Directory)已经拥有 200+ 应用,主要聚焦消费级场景——旅游、营养、消费金融、市场交易等。Sam Altman 公开表示目标是"成为所有人的 AI",这意味着 ChatGPT 将覆盖尽可能广泛的人群,而非仅瞄准付费订阅用户。

Claude 则明确选择了一条不同路径:纯订阅变现模式,深度服务于专业用户(Prosumer)。其应用商店同样有 200+ 应用,但与 ChatGPT 的重叠度仅有 11%。Claude 的生态围绕高端数据源、研究工具、科学工具和金融数据构建(如 PitchBook 等),目标受众是投资者、科学家和数学家。co-work、Claude Code、Excel 和 PowerPoint 集成都是在同一战略方向上的延伸。

Gemini 走的是第三条路。其增长几乎与创意工具的发布节奏完美绑定——V3、Nano Banana 1、Nano Banana Pro、Nano Banana 2 等版本的发布都伴随着活跃用户和付费用户的显著跃升。在专业用户领域,Gemini 也在逐步将 AI 融入 Gmail、Sheets、Calendar 等既有产品中,但这些都被归入现有产品的增强而非全新体验。

三、复利效应:为什么领先者会持续领先

Olivia 提出了一个深刻的问题:AI 产品的护城河正在如何形成?她将其概括为"上下文复利效应"(compounding advantages),即使用越多、产品越强、迁移成本越高的正向循环。

这一效应的核心驱动力有三个层面:

第一层:社交锁定。 ChatGPT 的群聊功能是一个典型的例子——如果所有朋友都在 ChatGPT 上互动,单个人的迁移就变成了一项社会协调难题。这与 WhatsApp、微信的逻辑如出一辙。

第二层:开发者生态集中。 随着各家应用商店的成型,开发者会倾向于将时间和精力集中在用户最多或付费意愿最强的平台上。对于消费级工具而言,"谁的用户最多"往往就是决定性的因素,这显然有利于 ChatGPT。

第三层:身份认证与记忆携带。 这是 Olivia 最为期待的方向。Sam Altman 曾暗示过 ChatGPT 认证层的构想——用户可以带着自己的记忆和 token 登录第三方应用,让这些应用借用 ChatGPT 已积累的个性化数据来提供更强大的服务。这意味着用户将更愿意把核心身份信息托管在 ChatGPT 上,因为它可以为所有其他应用赋能。对第三方开发者而言,用户自带推理能力(bring your own inference)还节省了推理成本——一个三方共赢的格局。

不过,Olivia 也指出了一个关键变量:工作身份和个人身份是否需要隔离?如果公司使用 ChatGPT 的企业版,员工自然会倾向于在个人生活中也延续使用同一产品;但反过来,也可能有人不想将工作记忆和个人记忆混为一谈。OpenAI 已在探索"多身份记忆分割"的功能,这将影响锁定效应的强弱。

四、Google 的 AI 转型:创意突围与巨轮转向

从 Bard 的惨淡开局到 Nano Banana 的爆红,Google 的 AI 之旅本身就是一则大公司创新的寓言。

Olivia 指出 Google 面临的核心矛盾在于:将 AI 植入核心产品(如 Docs、Sheets)意味着巨大的惯性成本——数十亿长期用户的使用习惯、多层级的管理审批、以及蚕食自身业务的风险。因此,Google 在这些传统产品上的 AI 动作目前仍以"最明显的增量改进"为主。

真正的突破来自"绿洲地带"——不受众多 VP 争夺的全新产品领域。NotebookLM 是第一个标志性案例,它在消费级 AI 音频领域创造了全新的体验。随后,来自 DeepMind 团队的图像和视频模型(Nano Banana 系列)接过了增长的接力棒。NotebookLM 最近甚至推出了视频生成功能,能将用户工作空间中的概念可视化呈现——这种不背负历史包袱、可以纯粹基于模型能力创新的产品,反而展现出了最强的生命力。

Olivia 也坦言,Google 在那些承载数十亿用户和大量企业合同的核心产品上未必需要激进——仅凭现有的锁定效应,短期内就足以维持用户基本盘。

五、全球 AI 地图:地缘政治重塑使用格局

本版报告首次显著扩展了地理维度的分析,结果令人惊异。

中俄的平行 AI 生态是最突出的发现。在中国,由于大量美国 AI 产品被审查或禁用,ChatGPT 和 Gemini 的合计使用率在所有国家中最低——仅 15%。取而代之的是字节跳动的豆包、DeepSeek、通义千问(Qwen)、Kimi 等本土产品构成的完整生态。俄罗斯的情况惊人地相似——受制裁影响,Giga Chat(国家关联公司开发)、Yandex 等本土产品占据主导,而 DeepSeek 在俄罗斯是除中国外的第二大市场。中俄两国的 AI 使用数据在所有国家中是两个最显著的离群值。

人均使用率的"隐秘冠军":a16z 对全球十大 LLM 产品的网页端和移动端数据进行了人均分析,结果中新加坡排名第一,紧随其后的是中国香港、阿联酋、韩国。而美国仅列第 20 位。Olivia 给出的解释有两层:一是这些领先地区的劳动力结构高度偏向科技白领高技能岗位,而美国仍有大量零售、运输等 AI 尚未触及的行业;二是文化态度——爱德曼(Edelman)全球调查显示,美国公众对 AI 的信任度仅为 32%,而这些高使用率国家的信任度普遍在 50-70%。在中国,对 AI 持正面看法的比例高达 80%。

此外,Olivia 还提到韩国和印度是值得密切关注的地区:韩国已有 Naver、Kakao 等本土 LLM 产品,而印度受益于巨大的人口基数和多语言需求,可能催生专门针对印度市场的 AI 产品。

六、创意工具的演进:从图像生成到多模态争夺

创意工具在 a16z 最初几期报告中曾占据主导地位,如今格局已发生深刻变化。

最显著的转变是独立图像生成器的退潮。Olivia 解释,对于制作表情包、基础营销图或信息图这类"商品化需求",ChatGPT 和 Gemini 内置的图像生成能力已经足够好。这意味着只有那些在美学上有强烈主张(如 Midjourney、Ideogram)或提供传统平台无法实现的复杂工作流的工具,才能在榜单上站稳脚跟。

与之相对的是音乐、语音和视频赛道的崛起。Suno(音乐)和 ElevenLabs(语音)已经进入 Top 20 并稳定占据位置,这些领域恰好是大型模型公司投入较少的,而社区效应和企业客户基础构成了持续的护城河。

视频领域是 Olivia 认为最具悬念的战场。OpenAI 的 Sora、Google 的 Veo 都在布局,但中国模型——尤其是 Kling 2(可灵 2)——在某些方面领先明显,因为它们能使用不受限制的训练数据。a16z 合伙人 Justine Moore 的判断是:视频领域不太可能出现"一统天下"的模型,用户需要能够根据不同场景切换不同的模型。这恰恰有利于 Krea 这类多模型聚合平台。

Sora 的社交实验提供了一个深刻的案例。Sora 上线时曾创造惊人数据——连续 20 天位居美国 App Store 榜首(意味着每日下载量约 15 万),百万用户增速甚至超过 ChatGPT 自身。目前仍有约 300 万日活跃用户(按 Sensor Tower 数据)。但新增下载量已从去年 11 月的峰值(月均 600 万)回落至约 150 万。

Olivia 的分析一针见血:Sora 作为视频模型是成功的(特别是引入了 Cameos 功能——真人可授权肖像用于生成视频,Jake Paul 等名人的病毒式传播推高了早期热度)。但作为社交应用则遇到了结构性难题——其内容本质上可导出至 TikTok、Instagram Reels 和 YouTube,在那里与人类顶级内容同台竞争,而纯 AI 内容的"情感筹码"天然更低。正如节目主持人所言,每个社交产品都有其地位游戏(status game),Sora 上形成的地位游戏是"谁最好笑",这与其他平台的地位逻辑并不兼容,导致内容难以跨平台传播。

不过 Olivia 指出 Sora 已与迪士尼等大型媒体公司签约,如果能成为唯一可以制作授权粉丝视频的地方,社交维度的价值将被重新定义。

七、智能体革命:从 OpenClaw 到 Manus

如果说本次报告有一个最令人振奋的主题,那就是智能体(Agent)的爆发。Olivia 甚至表示,过去两个月是她见证的最激动人心的时期。

OpenClaw 在本次报告的数据截止日(1月)之后才真正爆发,但 a16z 专门拉取了 2 月数据:如果当时具备资格,它将位列网页端榜单第 30 名。更震撼的是其开源影响力——GitHub 星标数已超越 React 和 Linux,成为历史第一。然而,访问注册页面的流量自 2 月初以来已趋于平稳,说明 OpenClaw 虽然对技术人群来说是极致产品,但尚未突破"技术圈层"进入主流消费者。

Olivia 的洞见是:OpenClaw 的真正影响力可能超越产品本身。它激励了一整代创业者——a16z 每天收到大量投资提案,创始人会说"我想做某个领域的 OpenClaw"或"OpenClaw 让我意识到这是可能的"。随着 OpenAI 收购 OpenClaw,一个关键变数是:被整合进 OpenAI 后是否会局限于 OpenAI 自有模型?目前它仍支持多模型调用,Olivia 认为保持这种开放性才是明智之举。

Manus 则代表了消费级智能体的标杆。它在不到一年的时间内实现从 0 到 1-2 亿美元 ARR 的增长,并被 Meta 以超过 20 亿美元收购。Olivia 认为 Manus 成功的根本原因是:它是第一个真正能在多个产品和平台之间相对自主运行的消费者级智能体——连接邮件、浏览网页、制作幻灯片和电子表格。一年前,ChatGPT Operator 和 Google Project Mariner 都远不够可靠,而 Manus 在智能体的可靠性和可及性上实现了质的突破。

这一收购也折射出一个深层行业趋势:当一个纯横向智能体产品做到极致时,它可能更适合被拥有巨大分发能力的平台公司(如 Meta、Google)收购并整合,而非独立运营。因为一旦底层模型能力普及,平台巨头的分发优势和既有企业合同就构成了难以抗衡的壁垒。但如果做的是垂直化智能体——专注于特定领域——独立公司的前景则完全不同。

Olivia 大胆预测:智能体的未来就像 1990 年代"dot com 公司"一样——当时"互联网公司"是一个专属标签,后来所有公司都成了互联网公司。同理,"智能体公司"这一标签将在不久后消失,因为每一家 AI 公司、乃至每一家科技公司,最终都将成为智能体驱动的公司。交付结果而非投入,这才是软件产品最根本的吸引力所在。

八、超越网页:桌面应用与 AI 浏览器

AI 产品走出浏览器窗口已成为不可逆的趋势,但这给 a16z 的排名方法论带来了新挑战——他们可以准确追踪网站访问和移动应用使用,但桌面应用的使用数据却难以精确测量。

Olivia 坦言,她日常使用的 AI 产品中相当一部分是桌面应用:Granola(会议笔记)、语音听写工具、Claude co-work 等。随着 AI 产品日益成熟,将它们放在独立的桌面应用中运行——可以访问用户文件、以更"环境化"的方式存在——将成为主流形态。对于 Cursor 这类收入最高但几乎没有网页端使用量的产品而言,仅靠网页和移动端排名已不足以反映真实格局。Olivia 认为未来的排名体系需要平行纳入收入维度。

AI 浏览器是另一个激烈交战的领域。Perplexity Comet、OpenAI Atlas、以及 Anthropic 的 Dia 都瞄准了"AI 无处不在"的浏览器入口。数据显示,Comet 的下载页访问量是 Atlas 的五倍——考虑到 ChatGPT 的庞大用户基础,这一差距尤为惊人。

但 Olivia 对 AI 浏览器的短期前景持谨慎态度:浏览器的迁移成本远高于大多数应用——用户已在 Chrome 等浏览器中积累了多年的工作流,自然状态下只会打开这一个应用。因此,AI 浏览器不能仅做到"功能对等",还需要有一到两个对普通用户来说真正杀手级且易于配置的功能。目前,AI 浏览器仍处于实验期,尚未出现这样的突破性功能。

九、今天的用户:AI 的实际使用图谱

一个容易被忽视的问题是:大众到底在用 AI 做什么?

Olivia 引用了一个非常具有洞察力的信源——青春期女孩。从社交媒体到短视频,历史上几乎所有最大的消费级产品爆发,年轻女性都是最早的采纳者。皮尤研究中心(Pew Research)的一项最新调查首次显示,超过一半的青少年承认使用 AI 完成家庭作业(Olivia 调侃实际数字"可能是 99.999%")。

具体数据:38% 的青少年使用 AI 创意工具(编辑和生成图像、视频);16% 用于日常闲聊——不是深度陪伴类产品,而只是"有人可以说话";12% 用于情感支持和人生建议。Olivia 认为这些用例最终都会趋近于 100% 的普及率。

值得注意的是,这些高情感需求的使用场景此前并没有被 AI 产品很好地满足,未来无论是通过 ChatGPT 这样的通用平台还是专门的垂直产品,都蕴藏着巨大的机会。

Olivia 还特别强调,智能体将解锁一批此前因数据获取和跨系统操作难度高而无法被 AI 有效覆盖的消费场景:金融、医疗、旅行规划、复杂购物等。在这些领域,AI 终于可以从"提供输入"进化为"交付结果"。

十、语音与记忆:下一个六个月的战场

在被问及对未来的展望时,Olivia 毫不掩饰她对两个方向的兴奋:语音和记忆。

语音是 Olivia 认为信息密度最高、质量最优的媒介——一个人每天大部分的行为都是"说"的上游或下游。过去六个月内,语音听写和会议 AI 转录已从工程师圈子逐渐扩散到更广的科技从业者群体,会议被 AI 录音和转写正在成为新常态。她判断,语音交互的主流化将在未来 6-9 个月内发生,无论是语音听写还是能够回答问题、执行任务的语音助手(如语音别针类产品)。

记忆则是 Olivia 眼中 AI 产品终极的护城河。当前 Claude 和 ChatGPT 在记忆功能上已有不俗表现,Google 也推出了 Personal Intelligence 功能,能跨文档、邮件等数据源提取个人信息以增强 AI 服务。但目前的体验有时会显得突兀——AI 可能会在不恰当的上下文中调用个人记忆来"帮助"你,反而造成不适。因此,记忆的基础设施层面——如何在不同身份和场景间正确分割一个人的信息——仍需大量打磨。

一旦这些问题得到解决,记忆将成为 AI 产品的核心优势。Olivia 给出了一个令人印象深刻的判断:两年后的任何产品,如果打开时不会立即让你感觉"它了解我",你就会觉得它是坏的。新用户上手引导(onboarding)这个概念将在几年后消失——因为记忆让 AI 从一开始就知道你是谁。她用自己的亲身经历佐证:使用 AI 产品两三个月后获得的价值,远高于刚开始使用时——这正是记忆复利的力量。

结语

从第六版百大 AI 应用报告之中,一条清晰的叙事线浮现出来:AI 产业正在从"模型军备竞赛"进入"生态级竞争"。基础模型的差异化不再仅来自技术参数,而越来越多地来自分发能力、应用生态、社交网络和记忆体系所构成的复合壁垒。与此同时,智能体的崛起正在改变 AI 产品的价值结构——从回答问题转向完成任务。语音和记忆作为两个最被低估的前沿,很可能在未来半年内重塑消费级 AI 的面貌。正如 Olivia 所说,每一次她试图预测,变化都比想象中来得更快——六个月后的下一版报告,"看起来会是完全不同的世界"。