AI工具超出预期:大规模AI生产力调查结果
摘要
本文由 Figma 的 AI 洞察经理 Noam Segal 撰写,呈现了对1,750名科技从业者(PM、工程师、设计师、创始人等)进行的大规模独立 AI 生产力调查的核心发现。关键结论:AI正在"超额交付"——55%受访者表示AI超出预期,过半每周节省至少半天时间。创始人收益最大(49%每周节省超6小时),设计师收益最少(仅45%报告正面ROI)。ChatGPT是最受欢迎工具,但工程师使用 Cursor(33.2%)、Claude Code(29.0%)等专业工具。文章深入分析了各职能的AI使用模式差距(PM用AI"生产"、创始人用AI"思考")、工具PMF(产品-市场匹配,Product-Market Fit)、Agent采用现状(n8n主导但仅14%活跃用户)、以及92.4%受访者报告的负面影响。最大机遇在于用户研究、文档编写、代码审查和测试编写等领域。
👋 嗨,我是 Lenny。
很高兴分享我与 Noam Segal 的第四次合作——Figma 的 AI 洞察经理,曾任 Zapier、Airbnb、Meta、Twitter、Intercom 和 Wealthfront 的 UXR(用户研究,User Experience Research)负责人。
关于 AI 对工作的影响,市场上不乏争论。它是否在交付真正的生产力收益?ROI 在哪里?各种激烈观点很多,但数据一直稀缺。
我们自己进行了调查——进行了最大规模的独立深度调查之一,了解 AI 如何影响科技从业者的生产力(1,750名受访者)。我们调查了产品经理、工程师、设计师、创始人和其他人关于他们在工作中如何使用 AI 的情况。
tl;dr(太长不看):AI 正在超额交付
- 55%的受访者表示 AI 超出预期,近70%表示 AI 提升了他们工作的质量。
- 超半数受访者表示 AI 在他们最重要的任务上每周至少节省半天时间。我们从未见过有工具能提供如此的生产力提升。
- 创始人从 AI 中获益最多。 半数(49%)报告 AI 每周为他们节省超过6小时,远高于任何其他角色。近半数(45%)还感觉工作质量因 AI"好得多"。
- 设计师看到的好处最少。 仅45%报告正面ROI(对比创始人78%),31%报告AI低于预期,是创始人中间比例的三倍。
- 工程师已接受 AI 作为编程伙伴,现在希望它处理更无聊(但必要)的产品构建工作: 文档编写、代码审查和测试编写。
- n8n 目前主导 Agent 平台格局,尽管2025年 Agentic 平台的实际采用仍缓慢。
- 高达92.4%的受访者报告至少一项使用 AI 工具的显著负面影响。 绝对有改进空间。
AI 已远非一两年前的新奇事物。它已明显占据工作和生产力基础设施的位置,AI 工具正在以惊人的速度改进。如果AI在2025年底已经给大多数人每周至少半天时间,那2026年会怎样?2027年呢?我们正在目睹一个复利式生产力革命的早期阶段。
正如 Kevin Weil(OpenAI VP)所说:"你今天使用的 AI 模型是你余生中将使用的所有 AI 模型中最差的一个。"
AI 对各职能的具体帮助
PM(产品经理) 从 AI 工具中获得最大价值的用途是:(1) 写 PRD(21.5%),(2) 创建低保真原型/模型(mockups/prototypes)(19.8%),(3) 改善沟通(18.5%)。
排第二的原型设计标志着当前正在发生的角色边界转变之一。有了 Lovable、v0 等工具,PM 越来越多地从想法直接到原型,无需等待设计师。
但往下看列表,一个模式浮现:AI 正在帮助 PM 产出,但在帮助 PM 思考方面落后。排前列的都是产出性任务(文档、原型、沟通),而策略和发现工作排在底部(用户研究4.7%,路线图创意1.1%)。PM 已经破解了如何用 AI 做"最后一英里"把想法从脑中拿出来,但用 AI 做上游工作——搞清楚该构建什么——仍有巨大机会。
(图表:PM AI 使用场景排名——写PRD 21.5%、原型 19.8%、沟通 18.5%、数据分析 8.3%、竞品研究 7.6%...用户研究 4.7%、路线图创意 1.1%)
设计师 发现 AI 在用户研究合成(22.3%)、内容和文案(17.4%)和设计概念构思(16.5%)方面最有帮助。视觉设计仅排第8,仅3.3%。
AI 正在帮助设计师做设计周边的一切(研究合成、文案、构思),但像素级设计仍然顽固地保持人性化。同时,比较原型设计:PM 将其排第2(19.8%),而设计师排第4(13.2%)。AI 正在为 PM 解锁核心工作之外的技能(至少在原型设计方面),而设计师则没有从 AI 做他们的核心工作中看到边际改进收益。
(图表:设计师 AI 使用场景排名)
创始人 强烈倾向于生产力和决策支持(32.9%)、产品构思(19.6%)和愿景/策略(19.1%)。
与其他人不同,创始人正在用 AI 思考,而不仅仅是生产。 前三项都是策略性的:决策支持、构思和愿景/策略。这与 PM(排前列的是文档和原型)和设计师(研究合成和文案)形成鲜明对比。而且看那个#1类别:"生产力/决策支持"32.9%,不同于调查中任何其他内容。没有其他职能有如此主导的单一用例。创始人将 AI 视为思考伙伴和回音壁,而不仅仅是特定交付物的工具。
意外缺失:财务建模仅1.8%,尽管创始人在融资期间活在电子表格中。招聘仅1.3%,尽管招聘消耗大量创始人时间。这些感觉像是等待更好工具的机会。
这个模式可能解释了为什么创始人在整个调查中报告最高满意度——他们想出了如何用 AI 做更高杠杆的策略性工作,而不仅仅是生产性任务。
(图表:创始人 AI 使用场景排名)
工程师是异常值。 对他们来说,AI 主要做一件大事:写代码,这是工程核心任务。而对 PM 和设计师,AI 在帮助做支持性工作。
往下是文档编写(7.7%)、测试(6.2%)和代码审查(4.3%)。这些是工程师通常讨厌的"无聊但必要"的任务。正如你将在下面的机会数据中看到,这即将改变。工程师已接受 AI 作为编程伙伴;现在他们希望它处理代码写完后的繁琐工作。
工程师是唯一 ChatGPT 不排第一的角色
ChatGPT 是大多数角色最受欢迎的 AI 工具:57.7%的 PM、49.6%的设计师和72.1%(!!)的创始人使用 ChatGPT 超过任何其他 AI 工具,Claude 为这三个角色排第二。
但工程师的行为非常不同。 GitHub Copilot 是先发优势者,拥有微软和 GitHub 的分发力量,并嵌入全球最流行的代码仓库。但它却排在三个比它晚发布工具之后。工程师正在选择更新的(更好的)替代品而非在位者。
对工程师,前三名几乎势均力敌:Cursor(33.2%)、ChatGPT(30.8%)和Claude Code(29.0%)都在4个百分点之内。这个市场尚未整合,切换成本低。Gemini 仅10.6%,但这个领域变化极快。
ChatGPT 对 PM 遥遥领先。 Perplexity 排名也出人意料地高,可能因其强大的研究能力。有趣的是,Lovable(8.7%)和Cursor(7.7%)进入了PM的前七名——强化了PM越来越多自己构建东西的模式,侵蚀着传统设计和工程工作。
AI 推动显著的时间和质量收益(对大多数而言)
63%的 PM 和83%的创始人报告 AI 每周节省4小时以上。 即使最怀疑的群体设计师,仍显示47.5%报告节省4小时以上。只有1%-5%的受访者说 AI"不比手动工作更快"。
(图表:各职能每周节省时间分布)
在质量方面,故事更具细微差别。PM 和创始人看好(超70%报告质量改善),但工程师更混合。51%的工程师告诉我们 AI 让他们工作质量更好,但21%说更差。 设计师介于中间,60%更好,13%更差。工程师的质量评级可能反映代码对正确性的更高标准:一份"稍微更好"的PRD初稿有用;一段"稍微更好"但有bug的函数不有用。而且坏代码比坏 PRD 更容易被发现。
机会在哪里?
AI 今天的实际使用场景与人们未来想用 AI 做的场景之间的差距,揭示了创始人和创业公司涌入提供新工具和功能的机会所在。
对 PM,最大的机会故事是研究。 用户研究显示最大的需求差距(+27.2个百分点)。仅4.7%说这是他们今天的主要 AI 用例,但近三分之一希望它成为。模式清晰:PM 已经想出了如何用 AI 做产出性任务,但他们渴望将其应用于上游——搞清楚该构建什么的混乱工作。
原型设计是爆款类别。 对 PM,"创建模型/原型"从19.8%(目前使用)跳到44.4%(接下来想使用),+24.6个百分点的跃升使其成为最想要的未来用例。对设计师,原型和交互设计显示类似势头(+27.8pp)。
工程师正在将 AI 使用转移到写代码之后的工作。 写代码是迄今最受欢迎的用例(51%当前),但需求差距仅+5.6pp。而文档编写(+25.8pp)、代码审查(+24.5pp)和测试编写(+23.5pp)全部显示工程 AI 工具的巨量增长机会。
创始人正在加倍押注AI作为思考伙伴。产品构思显示巨大需求,从19.6%(目前使用)跳到48.6%(想使用),+29.0pp的差距。增长策略和 GTM 规划(+24.7pp)和市场分析(+24.0pp)紧随其后。创始人已经在大量用AI做个人生产力(目前32.9%),但他们想向上游移动。他们在寻找策略合作者来压力测试想法、探索市场、思考进入市场——AI 作为联合创始人而不仅是助手。
基于这些报告的差距,下一波AI采用需要的不仅是更好的模型,而是更好的用于模糊问题上人机协作的工作流。写PRD有清晰产出;竞品研究没有。代码可以测试;"产品构思"不能。
哪些 AI 工具有产品-市场匹配?
我们问了经典的 Sean Ellis PMF(产品-市场匹配)问题:"失去哪个AI工具的访问权你会非常失望?"83.6%的人至少说出了一个工具,这本身就是一个关于AI已嵌入日常工作的惊人信号。
ChatGPT 占主导,但可能仅限现在。 半数受访者(50.2%)会非常失望失去 ChatGPT,但这明显低于使用该工具的60%-75%的比例。这在部分程度上解释了为什么 OpenAI 最近宣布"代码红色"(Code Red),因为它看到 Gemini 和 Claude 开始侵蚀市场份额。AI 中的切换成本仍然很低。
(图表:各工具的PMF评分——ChatGPT 50.2%、Claude 20.8%、Gemini 12.3%、Cursor 9.1%、Perplexity 7.0%...)
ChatGPT、Claude 和 Gemini 对 PM 排前三——它们是适合 PM 工作的多用途工具。 Cursor 紧随 Gemini 之后(我们不期望 Cursor 这样的工程工具在 PM 中如此受欢迎),之后是 Lovable(在原型市场似乎正在胜出)。
设计师(23.3%)和创始人(20.6%)对 Claude 的忠实度最高。Claude 生态(Claude + Claude Code 合计)达到27.5%总体。这对 Anthropic 来说感觉像大赢。
专业化工程工具已找到忠实用户和工程师间明确的产品-市场匹配。 对工程师,PMF 排行榜完全不同:ChatGPT(25.3%)、Cursor(20.7%)、Claude Code(17.1%)和Claude(13.4%)。他们会想念的四大产品中有三个是编程专用工具。
我们可以通过比较"主要使用"和"会非常失望失去"两个数字来衡量工具的"粘性"。如果比使用更多的人会想念它,这是强大 PMF 的信号。Granola,AI 会议笔记工具,是个好例子。在PM中,4.9%说会非常失望失去它,而仅约2%将其作为主要 AI 工具——约2.5倍比率。
超越通用 LLM,我们看到清晰的类别赢家浮现:
- 编程: Cursor(20.7% 工程师 PMF),Claude Code(17.1% 工程师 PMF)
- 原型设计: Lovable(7.5% PM PMF),Figma Make(6.8% 设计师 PMF),v0(4.4% PM PMF)
- 会议笔记: Granola(6.5% 创始人 PMF,4.9% PM PMF)
- 研究: Perplexity(9.8% 设计师 PMF,6.7% PM PMF)
AI 生产力的负面影响
生产力收益是真实的,但成本也是真实的。压倒性的92.4%受访者报告了至少一项AI工具的负面影响。 平均每人选了2.2个投诉项。
通用化产出和幻觉主导投诉列表。 前两个问题本质上是同一个问题从不同角度看:AI 产生要么太浅薄(56.2%)要么事实不可靠(51.9%)的内容。超半数受访者分别提到了这两项。含义很清晰——AI 产出需要大量人工审查和精炼,这直接导致第三个最多被提及的问题:管理AI产出花费的时间(37.7%)。生产力悖论:AI节省了生成内容的时间,但创造了审查它的新工作。
紧接第四(对PM实际排第三)的是担忧AI工具会侵蚀批判性思维。无论时间节省多少,许多受访者担心随着AI工具在工作流中普及,他们的长期技能可能面临风险。
设计师报告负面影响的比率最高;创始人最低。 63.2%的设计师提及幻觉,62.4%提及通用化产出,51.1%提及管理产出的时间。他们平均每人的投诉也最多(2.74 vs 创始人2.03)。
人们不抱怨什么也很有揭示意义。仅8.8%提及减少团队协作,仅6.1%报告工作流中断。AI会使团队原子化或打破现有流程的担忧并没有大规模实现。问题更平淡:AI产出需要编辑,AI有时编造东西,管理AI工具的元工作确实花时间。
附:Agentic AI 的状态:承诺超过实践
尽管业界对自主工作的 AI Agent 充满热议,实际采用仍处于起步阶段。 仅约25%的受访者以任何形式使用 Agent,仅14%算是"活跃"用户。近半数(49%)表达兴趣或计划实施 Agent——意图与行动之间的巨大差距信号既有机会也有摩擦。
n8n 主导 Agent 格局。 n8n 被提及219次,是 Zapier 的85次的两倍多。这令人惊讶考虑到 Zapier 更广泛的名气,但 n8n 的开源模型和开发者友好方法可能更契合这个技术导向的受众。Manus(35次提及)作为新进入者已排第三,表明市场仍然流动且对新手开放。
创始人引领使用;设计师 Agent 采用率最低。 四分之一创始人(26.2%)是活跃 Agent 用户,几乎是PM(12.1%)的两倍,接近设计师(9.4%)的三倍。
工作流仍然极大程度由人主导。 在使用 Agent 的人中,工作流仍大量是辅助而非自主。近半数(47%)报告工作流75%非 Agentic,仅7%报告主要是或完全是 Agentic。即使在创始人——最激进的采用者——中也只有12.5%达到75%+ Agentic。
障碍是组织性的,而非技术的。 公司限制阻挡了8.2%的潜在用户,尤其在工程(10.1%)和设计(10.5%)。另外7.8%认为当前无需求。仅4.8%完全不熟悉 Agent。这表明采用瓶颈不是意识或能力,而是组织准备度和明确用例。
这一切意味着什么
AI 已从玩具跨入工作马。
数字毫不含糊:55%说AI超出预期,大约四分之三的受访者会说AI已兑现或超越承诺。仅17.7%报告失望。以几乎任何产品标准,这些都是强劲数字。
时间压缩真实且戏剧性。
当受访者量化节省时,数字令人惊叹:
- PRD:"以前需要几天现在不到一小时。"
- 竞品研究:"多周研究项目变成几天的事情";"至少减少60%时间。"
- 原型设计:"以前需要一个月构建和验证的现在最多一天。有时最多一小时。"
- 用户研究合成:"几分钟的工作,以前需要几小时。"
一致的模式:知识工作上3-10倍的时间压缩,这些工作以前需要深厚专业知识或繁琐的手动努力。
并非现在每个人都在看到相同的好处。
仅45%的设计师报告正面ROI,31%说AI低于预期,是创始人比例的三倍。三种可能:(1) 设计专用的AI工具未达到所需水平。(2) 设计工作需要AI尚未交付的精确性和原创性。(3) 设计师对产出质量有更高标准。
大家都在谈论的 Agentic 未来?仍是大部分在谈论。 仅14%是活跃 Agent 用户,即使在他们中,工作流仍是75%+由人主导。"对 Agent 感兴趣"(49%)和"积极使用 Agent"(14%)之间的差距是下一波采用和下一波产品将出现的地方。
但工具格局正在快速变化。
我们追踪工具的方式需要更多是每周练习,或最多每月一次。持续了解每个人在使用什么、获得多少 ROI、最有影响力的 AI 用例。
人们不想用 AI 做他们工作中有趣的部分。他们想用它做讨厌的部分。
看看工程师想用 AI 做什么:文档、代码审查、测试。不是难的部分。是无聊的部分。
也许这是思考 AI 采用的顶层框架。将被改造最多的角色不是 AI 最"聪明"的地方,而是有最多繁琐杂务的地方。追随苦差事,你就会找到 AI 创造最多价值的地方。
当"展示给我看"击败"告诉我",角色边界开始模糊。
大约20%的PM示例提到了代码和 Cursor 等工具。PM 在构建原型。直接在产物中测试想法。如果演示变得比文档更快,PRD会怎样?传统的 PM/工程师交接会怎样?同理,设计师发货代码会怎样?我们认识了几十年的角色可能在几年内变得无法辨认。
提取最大价值的人共享一些共同点:
- 他们找到了自己的 AI 任务完成目标(Jobs-to-be-Done)。 最高影响力的 AI 用例是特定于角色的。试图用 AI 做一切意味着什么都掌握不了。选择 AI 可以节省最多时间或最改善产出的任务,深入钻研。
- 他们将 AI 当作合作者而非工具。 人们报告的质量收益不在打磨,而在全面性:AI 浮出他们可能错过的考量。把 AI 当作思考伙伴的人持续报告更高满意度和更好结果。
- 他们在向上游移动。 最大增长领域不是更快产出,而是在竞品研究、用户研究合成、产品构思中更早更好地思考。从"AI帮我写"到"AI帮我决定写什么"的转变是下一波生产力的来源。
- 他们接受权衡。 92%受访者提到至少一项负面影响。但获取最大价值的人并没有等待这些问题被解决。相反,他们构建了考虑这些问题的工作流。他们用 AI 做初稿而非终稿。他们在发货前验证。他们接受了"好到可以编辑"胜过"从零开始的完美"。
用AI获胜的人将其视为真正的合作者,一个需要上下文、迭代和现实期望,但以复利回报奖励投入的合作者。
从你最高杠杆的任务开始。给 AI 它需要的上下文。接受不完美的产出作为起点。通过小实验而非大赌注逐步建立信任。
混合型操作者——那些将人类判断与 AI 能力流畅结合的人——已经在超越同行。差距只会从这里扩大。
附录:谁参加了这项调查?
调查分布良好:约40%在小型公司(独自至50人),33%在中型公司(51-999人),28%在企业级组织(1,000+人)。最大单一群体是2-50名员工的创业公司(29.3%)。
这是一个经验丰富的受众。超半数(53%)有6-15年经验,近三分之一(33%)有16年+经验。仅14%处于职业早期(0-5年)。工程师尤其资深(51%有16年+),而 PM 集中在中职业生涯带(59%在6-15年)。经验水平有助于上下文化调查发现——这些都是有足够资历来形成对AI对工作影响的真实看法的实践者。
祝你度过充实而富有成效的一周 🙏