物理世界有投票权:Nominal联合创始人谈AI时代的硬件开发

cover>

摘要

Nominal正在构建硬件工程领域的"GitHub"——一个面向硬件测试、验证和数据分析的一体化AI数据平台。在美国快速再工业化、航空航天和国防投资激增的宏观背景下,Cameron和Jason发现了一个被长期忽视的关键环节:硬件测试。在设计工具和制造系统都有了自己的系统记录(System of Record)的时代,硬件测试仍然停留在PDF截图、本地MATLAB脚本和PPT报告的"2003年级别"状态。Nominal从测试切入,构建了一个统一的数据平台,让从研发、制造到现场运维的所有团队都能在同一套基础设施上协作。他们正在与美国国防高级研究计划局(DARPA)和美国空军合作,探索AI代理驱动的实时测试优化——将测试从顺序的矩阵燃烧转变为代理驱动的梯度曲线。正如他们反复强调的:"物理世界总会有投票权"——硬件测试不是可以"跳过"的环节,而是AI时代最关键的差异化能力。

正文

硬件测试:被遗忘的环节

Cameron用GitHub的类比来说明Nominal的定位。"如果你回顾软件开发的过去二十年,GitHub是一个版本控制系统(Version Control System, VCS)。但它经历了这样一个过程:企业最初在本地管理软件版本,然后开始内部集中化管理,最终它变得如此出色,以至于被产品化、外包化,风投资金涌入——这就是GitHub乃至整个CI/CD和DevOps工具栈的诞生。软件开发中的测试问题基本已经解决了。"

"但同样的奢侈品并不存在于成千上万的硬件工程师那里——他们正处在软件定义硬件(Software-Defined Hardware)、自主系统和机器人的前沿。"Cameron补充道,目前行业中大多数硬件开发数据仍然默认存储在本地——"网络可访问存储(NAS)还是常态,云并不普及。工程师从中央硬盘下载数据到自己的笔记本电脑,用各自独立的MATLAB或Python脚本进行分析,得出各自的结论。"

Jason进一步描述了这种碎片化:"20到30年前,硬件组织发展出了一种碎片化的模式——做仿真的人、做首批原型的人、做制造的人,都是不同团队,用不同的工具。当一切变得更加互联时,缺乏统一数据平台或基础设施的问题就变得非常明显。"

"我们谈的是像这样的事:你用截图把分析结果发回来。PDF、PowerPoint——这些仍然是许多公司的'工程前沿'。"Cameron总结道,"我们正在把行业从2003年左右的状态拉到2019、2020年。仅仅是好的软件实践和健全的数据工程。"

"物理世界有投票权"

节目的核心警句来自Cameron在Anduril的经历:"Physics gets a vote."(物理世界有投票权。)

"我在Anduril期间,大约2018-2019年左右,公司非常早期。那时候'一切都仿真'是很时髦的想法。但我看到了钟摆的摆动——从'让我们尽可能早地在设计生命周期中用仿真解决问题',到发现真正的力量来自将仿真输出和模型输出与来自物理系统的真实遥测传感器数据日志相融合。优势来自能够持续地、迭代地做这件事。"

Jason补充说,这不仅是技术问题,更是经济问题。"仿真和真实世界之间的鸿沟,部分原因是你需要验证你的数据是好的。比如一个机器人手臂折叠衣物的测试——如果伺服电机出了问题,那120秒的测试数据中可能只有一部分是高保真的。Nominal能在后台自动发现数据中的异常,告诉你'在120秒测试中只有这段时间的数据有足够高的保真度和信心'——然后你可以提取那部分数据来训练模型。"

为什么从测试切入?

当被问及为什么选择测试作为切入点(而非设计或制造)时,Cameron给出了三个理由。

首先,也是最务实的:测试是被忽视的领域,它没有自己的系统记录。"设计工具和制造端各有其系统记录,但测试没有。Nominal可以成为测试的系统记录。"

其次,测试的ROI是即时可见的。"在硬件开发中有一个口头禅:测试中的渐进式改进——每次节省几秒钟,复利成几分钟、几小时——对试图在竞争激烈的市场中将产品推向市场的客户来说,这是实实在在的价值。但每个人也知道,在任何一个重大硬件项目中,总有一些隐藏在数据中的东西——某种'全员上阵'级别的问题——可能让整个项目停滞。Nominal帮助客户发现这些隐藏的洞察。"

第三,也是最根本的:测试本质上是迭代的。"测试是最经典的实验性独立变量科学。这恰好是Nominal想要对齐的方向——驱动迭代。"Cameron还指出,一旦客户在测试阶段使用了Nominal的数据平台,他们自然会将其扩展到制造端的质量检测和现场运维的持续监测——"在测试中开发的那套验证逻辑,应该同样适用于生产线末端的质量检测,也应该同样部署到硬件系统的边缘端。"

DARPA与AI代理驱动的测试革命

Nominal正在与美国国防高级研究计划局(DARPA)和美国空军合作一个名为CIPHER(Cyber-Physical Systems Executing in Real-Time)的前沿项目。

Cameron描述了当前测试的现状和未来愿景。"对于一架大型飞机或武器系统的开发,测试工程就是一个巨大的矩阵——系统在这个条件下必须在某个值范围内,那个条件下必须在另一个值范围内。就是一个庞大的矩阵,非常顺序地燃烧——往往需要数年时间。"

"CIPHER的努力方向是:引入AI代理,以比实时更快的速度与数字孪生(Digital Twin)配对,推荐下一个最佳测试条件——一个知识最大化的下一个测试条件,速度极快。不是'飞一次、收集数据、检查是否满足一个离散的确定性测试点、降落、分析数据、再来一次'——而是,既然系统本身已经具有自主性,你可以实现极高续航力,在实时甚至比实时更快的速度下,将测试范式从顺序的矩阵燃烧转变为一条梯度曲线——通过持续地极速调整向量,重新训练模型,更新物理信息代理模型。"

"这是我们正在接近的涅槃境界。事实上我们正在与美国政府携手合作,他们拥有使这一切成为可能的测试范围和基础设施——这对我们来说非常令人兴奋。"

三套团队,三套技术栈

Jason剖析了一个典型机器人公司的组织结构。"我们通常看到三个团队,拥有三套完全不同的技术栈。"首先是制造团队——实际组装机器人的团队。其次是研发(R&D)团队——做原型设计和实验的团队。第三是客户现场运维(Fleet Operations)团队——观察机器人在野外表现、收集车载遥测数据的团队。

"三个不同的团队,三套完全不同的技术栈。Nominal跨所有三个场景发挥作用,这才是真正强大的地方——能够在现场部署的机器人系统发现问题后,追溯到R&D团队进行快速分类诊断,如果问题确实源自某个物理组件的故障或校准偏差,还可以继续追踪回到源头。我们的用户非常关心可追溯性(Traceability)——这个零件从哪来的?经过了哪些测试?在大规模系统上追踪这些信息变得极其复杂。"

AI在硬件领域的未来

当被问及"什么时候我们可以让AI设计、制造、测试和监测全新的硬件产品——就像在软件领域'Vibe Code'一样'Vibe Code一架飞机'?"时,Jason的回答既诚实又令人深思。

"我们离'Vibe Code硬件'还有很多很多步。很多步骤都回到了一个核心问题:这个系统是否在正常工作?甚至回到更基本的问题——我们如何拥有做硬件AI研究的训练数据集?很多都回到了数据收集、数据清洗、数据标准化的问题上。"他开玩笑说:"我现在还不能让AI来组装我的IKEA家具——如果能解决这个问题,我的人生就改变了。"

但Jason看到了令人兴奋的早期信号。他提到一个例子:在一次测试过程中,连操作人员之间的音频对话都是有价值的数据集。"在AI工具出现之前,收集这种数据似乎投入产出比太低。但现在——当然应该这样做,应该把所有数据集中到一处。"在未来几年中,仅仅是拥有了这样的数据资产,就可能解锁许多可能性。

展望未来,Cameron预见了硬件测试将迎来一个爆发期。"钟摆正在往回摆。我们正在意识到我们对物理系统在真实世界中的运行方式所知甚少,从数据的角度来看我们有多么匮乏。公司正在越来越多地构建硬件,我认为这将是一场收集这类数据并实际开发这些模型的竞赛。"

他用一个引人深思的类比总结:"如果你有AGI在为你的孩子设计一款视频游戏——你可能会让TA直接玩,而不需要严格的测试,毕竟只是一款游戏。但如果你有AGI在为你的孩子建造一个实体玩具——你会非常非常确定它在物理上不会造成危险。物理世界将永远不同于数字世界——因为那是我们真正生活的地方。"