AI工具超出预期：大规模AI生产力调查结果

Lennys.Newsletter · 2025-12-23

摘要

本文由 Figma 的 AI 洞察经理 Noam Segal 撰写，呈现了对1,750名科技从业者（PM、工程师、设计师、创始人等）进行的大规模独立 AI 生产力调查的核心发现。关键结论：AI正在"超额交付"——55%受访者表示AI超出预期，过半每周节省至少半天时间。创始人收益最大（49%每周节省超6小时），设计师收益最少（仅45%报告正面ROI）。ChatGPT是最受欢迎工具，但工程师使用 Cursor（33.2%）、Claude Code（29.0%）等专业工具。文章深入分析了各职能的AI使用模式差距（PM用AI"生产"、创始人用AI"思考"）、工具PMF（产品-市场匹配，Product-Market Fit）、Agent采用现状（n8n主导但仅14%活跃用户）、以及92.4%受访者报告的负面影响。最大机遇在于用户研究、文档编写、代码审查和测试编写等领域。

👋 嗨，我是 Lenny。

很高兴分享我与 Noam Segal 的第四次合作——Figma 的 AI 洞察经理，曾任 Zapier、Airbnb、Meta、Twitter、Intercom 和 Wealthfront 的 UXR（用户研究，User Experience Research）负责人。

关于 AI 对工作的影响，市场上不乏争论。它是否在交付真正的生产力收益？ROI 在哪里？各种激烈观点很多，但数据一直稀缺。

我们自己进行了调查——进行了最大规模的独立深度调查之一，了解 AI 如何影响科技从业者的生产力（1,750名受访者）。我们调查了产品经理、工程师、设计师、创始人和其他人关于他们在工作中如何使用 AI 的情况。

tl;dr（太长不看）：AI 正在超额交付

55%的受访者表示 AI 超出预期，近70%表示 AI 提升了他们工作的质量。
超半数受访者表示 AI 在他们最重要的任务上每周至少节省半天时间。我们从未见过有工具能提供如此的生产力提升。
创始人从 AI 中获益最多。 半数（49%）报告 AI 每周为他们节省超过6小时，远高于任何其他角色。近半数（45%）还感觉工作质量因 AI"好得多"。
设计师看到的好处最少。 仅45%报告正面ROI（对比创始人78%），31%报告AI低于预期，是创始人中间比例的三倍。
工程师已接受 AI 作为编程伙伴，现在希望它处理更无聊（但必要）的产品构建工作： 文档编写、代码审查和测试编写。
n8n 目前主导 Agent 平台格局，尽管2025年 Agentic 平台的实际采用仍缓慢。
高达92.4%的受访者报告至少一项使用 AI 工具的显著负面影响。 绝对有改进空间。

AI 已远非一两年前的新奇事物。它已明显占据工作和生产力基础设施的位置，AI 工具正在以惊人的速度改进。如果AI在2025年底已经给大多数人每周至少半天时间，那2026年会怎样？2027年呢？我们正在目睹一个复利式生产力革命的早期阶段。

正如 Kevin Weil（OpenAI VP）所说："你今天使用的 AI 模型是你余生中将使用的所有 AI 模型中最差的一个。"

AI 对各职能的具体帮助

PM（产品经理） 从 AI 工具中获得最大价值的用途是：(1) 写 PRD（21.5%），(2) 创建低保真原型/模型（mockups/prototypes）（19.8%），(3) 改善沟通（18.5%）。

排第二的原型设计标志着当前正在发生的角色边界转变之一。有了 Lovable、v0 等工具，PM 越来越多地从想法直接到原型，无需等待设计师。

但往下看列表，一个模式浮现：AI 正在帮助 PM 产出，但在帮助 PM 思考方面落后。排前列的都是产出性任务（文档、原型、沟通），而策略和发现工作排在底部（用户研究4.7%，路线图创意1.1%）。PM 已经破解了如何用 AI 做"最后一英里"把想法从脑中拿出来，但用 AI 做上游工作——搞清楚该构建什么——仍有巨大机会。

（图表：PM AI 使用场景排名——写PRD 21.5%、原型 19.8%、沟通 18.5%、数据分析 8.3%、竞品研究 7.6%...用户研究 4.7%、路线图创意 1.1%）

设计师 发现 AI 在用户研究合成（22.3%）、内容和文案（17.4%）和设计概念构思（16.5%）方面最有帮助。视觉设计仅排第8，仅3.3%。

AI 正在帮助设计师做设计周边的一切（研究合成、文案、构思），但像素级设计仍然顽固地保持人性化。同时，比较原型设计：PM 将其排第2（19.8%），而设计师排第4（13.2%）。AI 正在为 PM 解锁核心工作之外的技能（至少在原型设计方面），而设计师则没有从 AI 做他们的核心工作中看到边际改进收益。

（图表：设计师 AI 使用场景排名）

创始人 强烈倾向于生产力和决策支持（32.9%）、产品构思（19.6%）和愿景/策略（19.1%）。

与其他人不同，创始人正在用 AI 思考，而不仅仅是生产。 前三项都是策略性的：决策支持、构思和愿景/策略。这与 PM（排前列的是文档和原型）和设计师（研究合成和文案）形成鲜明对比。而且看那个#1类别："生产力/决策支持"32.9%，不同于调查中任何其他内容。没有其他职能有如此主导的单一用例。创始人将 AI 视为思考伙伴和回音壁，而不仅仅是特定交付物的工具。

意外缺失：财务建模仅1.8%，尽管创始人在融资期间活在电子表格中。招聘仅1.3%，尽管招聘消耗大量创始人时间。这些感觉像是等待更好工具的机会。

这个模式可能解释了为什么创始人在整个调查中报告最高满意度——他们想出了如何用 AI 做更高杠杆的策略性工作，而不仅仅是生产性任务。

（图表：创始人 AI 使用场景排名）

工程师是异常值。 对他们来说，AI 主要做一件大事：写代码，这是工程核心任务。而对 PM 和设计师，AI 在帮助做支持性工作。

往下是文档编写（7.7%）、测试（6.2%）和代码审查（4.3%）。这些是工程师通常讨厌的"无聊但必要"的任务。正如你将在下面的机会数据中看到，这即将改变。工程师已接受 AI 作为编程伙伴；现在他们希望它处理代码写完后的繁琐工作。

工程师是唯一 ChatGPT 不排第一的角色

ChatGPT 是大多数角色最受欢迎的 AI 工具：57.7%的 PM、49.6%的设计师和72.1%（！！）的创始人使用 ChatGPT 超过任何其他 AI 工具，Claude 为这三个角色排第二。

但工程师的行为非常不同。 GitHub Copilot 是先发优势者，拥有微软和 GitHub 的分发力量，并嵌入全球最流行的代码仓库。但它却排在三个比它晚发布工具之后。工程师正在选择更新的（更好的）替代品而非在位者。

对工程师，前三名几乎势均力敌：Cursor（33.2%）、ChatGPT（30.8%）和Claude Code（29.0%）都在4个百分点之内。这个市场尚未整合，切换成本低。Gemini 仅10.6%，但这个领域变化极快。

ChatGPT 对 PM 遥遥领先。 Perplexity 排名也出人意料地高，可能因其强大的研究能力。有趣的是，Lovable（8.7%）和Cursor（7.7%）进入了PM的前七名——强化了PM越来越多自己构建东西的模式，侵蚀着传统设计和工程工作。

AI 推动显著的时间和质量收益（对大多数而言）

63%的 PM 和83%的创始人报告 AI 每周节省4小时以上。 即使最怀疑的群体设计师，仍显示47.5%报告节省4小时以上。只有1%-5%的受访者说 AI"不比手动工作更快"。

（图表：各职能每周节省时间分布）

在质量方面，故事更具细微差别。PM 和创始人看好（超70%报告质量改善），但工程师更混合。51%的工程师告诉我们 AI 让他们工作质量更好，但21%说更差。 设计师介于中间，60%更好，13%更差。工程师的质量评级可能反映代码对正确性的更高标准：一份"稍微更好"的PRD初稿有用；一段"稍微更好"但有bug的函数不有用。而且坏代码比坏 PRD 更容易被发现。

机会在哪里？

AI 今天的实际使用场景与人们未来想用 AI 做的场景之间的差距，揭示了创始人和创业公司涌入提供新工具和功能的机会所在。

对 PM，最大的机会故事是研究。 用户研究显示最大的需求差距（+27.2个百分点）。仅4.7%说这是他们今天的主要 AI 用例，但近三分之一希望它成为。模式清晰：PM 已经想出了如何用 AI 做产出性任务，但他们渴望将其应用于上游——搞清楚该构建什么的混乱工作。

原型设计是爆款类别。 对 PM，"创建模型/原型"从19.8%（目前使用）跳到44.4%（接下来想使用），+24.6个百分点的跃升使其成为最想要的未来用例。对设计师，原型和交互设计显示类似势头（+27.8pp）。

工程师正在将 AI 使用转移到写代码之后的工作。 写代码是迄今最受欢迎的用例（51%当前），但需求差距仅+5.6pp。而文档编写（+25.8pp）、代码审查（+24.5pp）和测试编写（+23.5pp）全部显示工程 AI 工具的巨量增长机会。

创始人正在加倍押注AI作为思考伙伴。产品构思显示巨大需求，从19.6%（目前使用）跳到48.6%（想使用），+29.0pp的差距。增长策略和 GTM 规划（+24.7pp）和市场分析（+24.0pp）紧随其后。创始人已经在大量用AI做个人生产力（目前32.9%），但他们想向上游移动。他们在寻找策略合作者来压力测试想法、探索市场、思考进入市场——AI 作为联合创始人而不仅是助手。

基于这些报告的差距，下一波AI采用需要的不仅是更好的模型，而是更好的用于模糊问题上人机协作的工作流。写PRD有清晰产出；竞品研究没有。代码可以测试；"产品构思"不能。

哪些 AI 工具有产品-市场匹配？

我们问了经典的 Sean Ellis PMF（产品-市场匹配）问题："失去哪个AI工具的访问权你会非常失望？"83.6%的人至少说出了一个工具，这本身就是一个关于AI已嵌入日常工作的惊人信号。

ChatGPT 占主导，但可能仅限现在。 半数受访者（50.2%）会非常失望失去 ChatGPT，但这明显低于使用该工具的60%-75%的比例。这在部分程度上解释了为什么 OpenAI 最近宣布"代码红色"（Code Red），因为它看到 Gemini 和 Claude 开始侵蚀市场份额。AI 中的切换成本仍然很低。

（图表：各工具的PMF评分——ChatGPT 50.2%、Claude 20.8%、Gemini 12.3%、Cursor 9.1%、Perplexity 7.0%...）

ChatGPT、Claude 和 Gemini 对 PM 排前三——它们是适合 PM 工作的多用途工具。 Cursor 紧随 Gemini 之后（我们不期望 Cursor 这样的工程工具在 PM 中如此受欢迎），之后是 Lovable（在原型市场似乎正在胜出）。

设计师（23.3%）和创始人（20.6%）对 Claude 的忠实度最高。Claude 生态（Claude + Claude Code 合计）达到27.5%总体。这对 Anthropic 来说感觉像大赢。

专业化工程工具已找到忠实用户和工程师间明确的产品-市场匹配。 对工程师，PMF 排行榜完全不同：ChatGPT（25.3%）、Cursor（20.7%）、Claude Code（17.1%）和Claude（13.4%）。他们会想念的四大产品中有三个是编程专用工具。

我们可以通过比较"主要使用"和"会非常失望失去"两个数字来衡量工具的"粘性"。如果比使用更多的人会想念它，这是强大 PMF 的信号。Granola，AI 会议笔记工具，是个好例子。在PM中，4.9%说会非常失望失去它，而仅约2%将其作为主要 AI 工具——约2.5倍比率。

超越通用 LLM，我们看到清晰的类别赢家浮现：

编程： Cursor（20.7% 工程师 PMF），Claude Code（17.1% 工程师 PMF）
原型设计： Lovable（7.5% PM PMF），Figma Make（6.8% 设计师 PMF），v0（4.4% PM PMF）
会议笔记： Granola（6.5% 创始人 PMF，4.9% PM PMF）
研究： Perplexity（9.8% 设计师 PMF，6.7% PM PMF）

AI 生产力的负面影响

生产力收益是真实的，但成本也是真实的。压倒性的92.4%受访者报告了至少一项AI工具的负面影响。 平均每人选了2.2个投诉项。

通用化产出和幻觉主导投诉列表。 前两个问题本质上是同一个问题从不同角度看：AI 产生要么太浅薄（56.2%）要么事实不可靠（51.9%）的内容。超半数受访者分别提到了这两项。含义很清晰——AI 产出需要大量人工审查和精炼，这直接导致第三个最多被提及的问题：管理AI产出花费的时间（37.7%）。生产力悖论：AI节省了生成内容的时间，但创造了审查它的新工作。

紧接第四（对PM实际排第三）的是担忧AI工具会侵蚀批判性思维。无论时间节省多少，许多受访者担心随着AI工具在工作流中普及，他们的长期技能可能面临风险。

设计师报告负面影响的比率最高；创始人最低。 63.2%的设计师提及幻觉，62.4%提及通用化产出，51.1%提及管理产出的时间。他们平均每人的投诉也最多（2.74 vs 创始人2.03）。

人们不抱怨什么也很有揭示意义。仅8.8%提及减少团队协作，仅6.1%报告工作流中断。AI会使团队原子化或打破现有流程的担忧并没有大规模实现。问题更平淡：AI产出需要编辑，AI有时编造东西，管理AI工具的元工作确实花时间。

附：Agentic AI 的状态：承诺超过实践

尽管业界对自主工作的 AI Agent 充满热议，实际采用仍处于起步阶段。 仅约25%的受访者以任何形式使用 Agent，仅14%算是"活跃"用户。近半数（49%）表达兴趣或计划实施 Agent——意图与行动之间的巨大差距信号既有机会也有摩擦。

n8n 主导 Agent 格局。 n8n 被提及219次，是 Zapier 的85次的两倍多。这令人惊讶考虑到 Zapier 更广泛的名气，但 n8n 的开源模型和开发者友好方法可能更契合这个技术导向的受众。Manus（35次提及）作为新进入者已排第三，表明市场仍然流动且对新手开放。

创始人引领使用；设计师 Agent 采用率最低。 四分之一创始人（26.2%）是活跃 Agent 用户，几乎是PM（12.1%）的两倍，接近设计师（9.4%）的三倍。

工作流仍然极大程度由人主导。 在使用 Agent 的人中，工作流仍大量是辅助而非自主。近半数（47%）报告工作流75%非 Agentic，仅7%报告主要是或完全是 Agentic。即使在创始人——最激进的采用者——中也只有12.5%达到75%+ Agentic。

障碍是组织性的，而非技术的。 公司限制阻挡了8.2%的潜在用户，尤其在工程（10.1%）和设计（10.5%）。另外7.8%认为当前无需求。仅4.8%完全不熟悉 Agent。这表明采用瓶颈不是意识或能力，而是组织准备度和明确用例。

这一切意味着什么

AI 已从玩具跨入工作马。

数字毫不含糊：55%说AI超出预期，大约四分之三的受访者会说AI已兑现或超越承诺。仅17.7%报告失望。以几乎任何产品标准，这些都是强劲数字。

时间压缩真实且戏剧性。

当受访者量化节省时，数字令人惊叹：
- PRD："以前需要几天现在不到一小时。"
- 竞品研究："多周研究项目变成几天的事情"；"至少减少60%时间。"
- 原型设计："以前需要一个月构建和验证的现在最多一天。有时最多一小时。"
- 用户研究合成："几分钟的工作，以前需要几小时。"

一致的模式：知识工作上3-10倍的时间压缩，这些工作以前需要深厚专业知识或繁琐的手动努力。

并非现在每个人都在看到相同的好处。

仅45%的设计师报告正面ROI，31%说AI低于预期，是创始人比例的三倍。三种可能：(1) 设计专用的AI工具未达到所需水平。(2) 设计工作需要AI尚未交付的精确性和原创性。(3) 设计师对产出质量有更高标准。

大家都在谈论的 Agentic 未来？仍是大部分在谈论。 仅14%是活跃 Agent 用户，即使在他们中，工作流仍是75%+由人主导。"对 Agent 感兴趣"（49%）和"积极使用 Agent"（14%）之间的差距是下一波采用和下一波产品将出现的地方。

但工具格局正在快速变化。

我们追踪工具的方式需要更多是每周练习，或最多每月一次。持续了解每个人在使用什么、获得多少 ROI、最有影响力的 AI 用例。

人们不想用 AI 做他们工作中有趣的部分。他们想用它做讨厌的部分。

看看工程师想用 AI 做什么：文档、代码审查、测试。不是难的部分。是无聊的部分。

也许这是思考 AI 采用的顶层框架。将被改造最多的角色不是 AI 最"聪明"的地方，而是有最多繁琐杂务的地方。追随苦差事，你就会找到 AI 创造最多价值的地方。

当"展示给我看"击败"告诉我"，角色边界开始模糊。

大约20%的PM示例提到了代码和 Cursor 等工具。PM 在构建原型。直接在产物中测试想法。如果演示变得比文档更快，PRD会怎样？传统的 PM/工程师交接会怎样？同理，设计师发货代码会怎样？我们认识了几十年的角色可能在几年内变得无法辨认。

提取最大价值的人共享一些共同点：

他们找到了自己的 AI 任务完成目标（Jobs-to-be-Done）。 最高影响力的 AI 用例是特定于角色的。试图用 AI 做一切意味着什么都掌握不了。选择 AI 可以节省最多时间或最改善产出的任务，深入钻研。
他们将 AI 当作合作者而非工具。 人们报告的质量收益不在打磨，而在全面性：AI 浮出他们可能错过的考量。把 AI 当作思考伙伴的人持续报告更高满意度和更好结果。
他们在向上游移动。 最大增长领域不是更快产出，而是在竞品研究、用户研究合成、产品构思中更早更好地思考。从"AI帮我写"到"AI帮我决定写什么"的转变是下一波生产力的来源。
他们接受权衡。 92%受访者提到至少一项负面影响。但获取最大价值的人并没有等待这些问题被解决。相反，他们构建了考虑这些问题的工作流。他们用 AI 做初稿而非终稿。他们在发货前验证。他们接受了"好到可以编辑"胜过"从零开始的完美"。

用AI获胜的人将其视为真正的合作者，一个需要上下文、迭代和现实期望，但以复利回报奖励投入的合作者。

从你最高杠杆的任务开始。给 AI 它需要的上下文。接受不完美的产出作为起点。通过小实验而非大赌注逐步建立信任。

混合型操作者——那些将人类判断与 AI 能力流畅结合的人——已经在超越同行。差距只会从这里扩大。

附录：谁参加了这项调查？

调查分布良好：约40%在小型公司（独自至50人），33%在中型公司（51-999人），28%在企业级组织（1,000+人）。最大单一群体是2-50名员工的创业公司（29.3%）。

这是一个经验丰富的受众。超半数（53%）有6-15年经验，近三分之一（33%）有16年+经验。仅14%处于职业早期（0-5年）。工程师尤其资深（51%有16年+），而 PM 集中在中职业生涯带（59%在6-15年）。经验水平有助于上下文化调查发现——这些都是有足够资历来形成对AI对工作影响的真实看法的实践者。

祝你度过充实而富有成效的一周 🙏