当人工智能从"比特"世界跨入"原子"世界,会发生什么?三家物理 AI 最前沿的创业公司分享他们的探索与洞察。
观看完整视频视频游戏提供了精确的动作-帧对应关系,这是构建世界模型的理想数据,物理世界视频无法在毫秒级别准确标注。
材料科学的搜索空间如此庞大,传统方法需要 700 万年。只有 AI + 自动驾驶实验室的组合才能将其压缩到可操作范围。
Bits to Bits(已超速)→ Bits to Atoms(受测量系统约束)→ Atoms to Atoms(完全自动化物理世界)。创业机会在后两个阶段。
消费级机器人必须先解决安全性问题。小型、可爱的机器人降低了部署风险,也为技术不完美提供了情感缓冲。
大型科技公司因组织臃肿而行动迟缓,创业公司通过专注、速度和客户关系获得结构性优势。Anthropic 的成功案例证明了这一点。
基于纯计算数据的模型只发现"材料的想法",只有通过自动化实验室真正合成和测试,才能将想法转化为可用的材料。
安全性是消费级机器人进入家庭的首要门槛,而"可爱"的设计能够降低用户的容忍度阈值。
Fauna Robotics 被亚马逊收购的消息在行业内引发广泛关注。Rob Cochran 分享了这次收购背后的逻辑:亚马逊真正认同他们关于机器人如何与人类共同生活和工作的愿景。
Fauna Robotics 没有直接冲向全尺寸人形机器人,而是推出了 Sprout——一个 3.5 英尺高、50 磅重的"可爱"小型机器人。这个选择背后是深刻的用户洞察。
一个 150-200 磅的机器如果倒向孩子或老人,后果不堪设想。在当前技术尚不完美的情况下,部署这样的风险到真实家庭是不可接受的。
当机器人无法完美工作时,用户对"可爱"的事物会更加宽容。这种情感缓冲为技术迭代提供了宝贵的空间。
作为开发平台,Sprout 可以在多种实验场景中部署,让 AI 实验室和研究机构能够在其上构建和扩展能力。
从小型安全平台开始,逐步向更复杂形态演进——这种策略折射出机器人创业公司务实的产品思维。
视频游戏数据为构建物理世界的世界模型提供了独特优势——精确的动作-帧对应关系。
Pim 在 Discord 平台变革期创立了 Metal(最大的游戏录制应用之一),当 LLM 浪潮来临时,他意识到手中的游戏数据可能有更大价值。
精确的动作标注:在视频游戏中,每个动作(按键、手柄输入)和对应的画面帧之间有精确的时间对应关系。这是物理世界数据无法比拟的——即使是最好的人类标注员,也无法在 100 毫秒级别准确标注物理视频中的动作因果关系。
与文本和图片不同,游戏包含随时间展开的复杂空间关系和环境变化,这正是物理世界智能体需要的推理能力。
海量游戏数据支持整个基础模型的预训练,这是传统机器人数据无法实现的规模。
Pim 对"世界模型"的定义简洁而深刻:动作 + 帧 = 下一帧。这种因果关系的理解,正是从"预测"走向"推理"的关键一步。
AI 科学家 + 自动驾驶实验室 = 从"想法"到"材料"的闭环,将 700 万年的探索时间压缩到可操作范围。
Joseph Krauss 提出了一个令人震惊的数字:在结构金属领域,有 10^40 种可能的材料组合。这个数字如此庞大,以至于相当于"一百万亿个地球"的探索空间。以传统方式,这需要 700 万年才能穷尽。
AI 科学家("Rad"):一个基于 GPT-4 和 Claude 的 LLM,经过微调以理解材料科学。它的角色就像实验室的首席研究员(PI)——理解需求、设计实验、分析结果、做出决策。
完全自动化的实验设施,可以高通量地合成材料、表征材料、测试材料,并捕获所有数据。
传统材料实验中,大部分数据从未被系统化记录。而 Radical AI 的实验室捕获每一个实验的完整信息——条件、过程、结果——这是构建材料科学基础模型的关键数据。
他们的第一个目标材料是高熵合金——一种包含 5-7 种元素、具有极高熵的材料,能够在极端环境(如 10 马赫太空飞行)下保持性能。这种材料的发现传统上需要数十年,而 AI 驱动的实验室有望将其压缩到数月。
LLM 解决了机器人技术的"规划"问题,但物理操控仍需仿真和控制领域的突破。
LLM 是规划能力的革命性进步。以前,机器人"从冰箱拿零食"这样的任务需要硬编码的结构化规划;现在,LLM 可以灵活地处理变化——比如冰箱里没有目标饮料时选择替代品。但他强调,更大的创新来自嵌入式 GPU、现成致动器、物理逼真仿真环境等基础设施的进步。
LLM 改变了工程师的角色。以前,工程师需要手动编写仿真环境(基于牛顿物理学等近似);现在,工程师可以让 LLM 生成大量环境,然后用验证器筛选出有效的。这从"控制输出"变为"验证输出",是巨大的力量倍增器。
他们的 AI 科学家"Rad"是基于 LLM 的,但人类科学家仍在循环中——他们需要告诉 AI 什么是"好"的实验,从而构建训练数据集。同时,他们还需要构建领域特定的模型(如扩散模型),因为材料科学没有现成的模型可以直接使用。
这场讨论揭示了 LLM 在物理 AI 中的真实角色:不是万能解决方案,而是强大的规划、推理和接口工具,需要与领域特定技术结合才能发挥作用。
从"比特到比特"到"原子到原子",AI 的发展将经历三个截然不同的阶段,每个阶段面临不同的技术挑战。
Pim 分享了从 Andrej Karpathy 那里学到的框架,将 AGI 的发展划分为三个阶段。
数字到数字的转换。这是当前 LLM 所在的领域——文本、代码、图像等纯数字内容。这个领域已经进入"超速"发展阶段,没有明显的限制。
数字与物理世界的接口层。这是传感器、测量系统、执行器等"桥梁"技术的领域。这个领域受到测量系统的约束——我们仍需构建能够准确感知和操控物理世界的基础设施。
物理系统直接修改物理系统。这是完全自动化的物理世界,机器人可以在没有人类干预的情况下制造和操作物理实体。这需要前两个阶段的完整实现。
这个框架不仅解释了为什么物理 AI 比纯数字 AI 更困难,也指明了创业机会所在:在 Bits to Bits 领域竞争激烈的今天,Bits to Atoms 和 Atoms to Atoms 领域仍有巨大空间。
Joseph 补充了材料科学的角度——他们称之为"并发工程"(concurrent engineering):传统上,设计新产品(如飞机)时,材料是从几十年前的库存中选择的;而未来,材料应该与产品同时设计,直接满足特定需求。这正是从 Bits to Bits(材料设计)到 Atoms to Atoms(产品制造)的完整闭环。
在深度技术领域,创业公司的优势不是资源,而是专注、速度和与客户的紧密关系。
当被问及如何应对大型科技公司的竞争时,三位创始人的回答出奇一致:**零担心**。
他几乎不考虑竞争。"我认为这只是对精神大脑空间的浪费。你作为团队只有一项工作,那就是执行你的使命,成为世界上最好的。"他指出,在材料科学这样高度专业化的领域,大型科技公司(Meta、微软、谷歌)没有结构性优势——他们不会与 Radical AI 竞争,因为这不符合他们的核心业务。
他用 Anthropic 的成功作为案例——Anthropic 不是 incumbent,但通过专注于客户需求和代码质量,他们正在"赢得"竞争。"他们只是与客户一起快速行动,这是 OpenAI 和谷歌无法做到的,因为它们是更大、更臃肿、更分散的组织。"
他两次成功出售公司(Control Labs 给 Meta,Fauna Robotics 给亚马逊),他认为小公司可以做大公司很难做到的事情——**专注**和**有主见的产品**。"在最早阶段,关于如何将那个火花变成有意义的东西,大公司更难做到这一点。"
Rob 还给出了创业者的战术建议:定义一套有意义的目标,与资金里程碑一致;将有限资源集中在能区分你的问题上;对资本密集型领域(如机器人),要提前规划多轮融资的路径;避免变得"不可收购"——规模过大会限制退出选项。
发现"材料想法"和制造"真实材料"是完全不同的事情,后者需要解决吞吐量和资格认证两大挑战。
一位观众提出了尖锐的问题:Google DeepMind 的 GNoME 发现了 220 万种新材料,其中 4 万种是稳定的——但如何制造它们?如何说服人们使用它们?
Joseph 指出,许多基于纯计算数据的模型(如 GNoME、MatterGen)实际上只发现了"材料的想法",而非真正的材料。"如果你给世界上的任何客户打电话,说:'看,我在电脑屏幕上为你制作的这个惊人材料。'他们会说:'是啊,很酷。你能在邮件里发送给我吗?'"
只有真正合成、表征、测试材料,才能将想法转化为现实。这就是 Radical AI 构建自动化实验室的原因。
在航空航天等关键行业,新材料需要通过严格的资格认证才能使用。令人惊讶的是,Joseph 发现行业趋势是**反向垂直整合**——航空航天公司正在内部建立材料团队,绕过传统的资格认证流程,为自己制造的材料"背书"。
这揭示了一个深刻洞察:当传统流程过于缓慢时,产业链上的巨头会主动寻找捷径,为创新公司打开机会窗口。
消费级机器人必须先解决安全性问题。小型、可爱的机器人(如 Sprout)降低了部署风险,也为技术不完美提供了情感缓冲。
视频游戏提供了精确的动作-帧对应关系,这是构建世界模型的理想数据。物理世界的视频数据无法在毫秒级别准确标注动作因果关系。
材料科学的搜索空间如此庞大(10^40 种组合),传统方法需要 700 万年。只有 AI + 自动驾驶实验室的组合才能将其压缩到可操作范围。
Bits to Bits(已超速)→ Bits to Atoms(受测量系统约束)→ Atoms to Atoms(完全自动化物理世界)。创业机会在后两个阶段。
大型科技公司因组织臃肿而行动迟缓,创业公司通过专注、速度和客户关系获得结构性优势。Anthropic 的成功案例证明了这一点。
基于纯计算数据的模型只发现"材料的想法",只有通过自动化实验室真正合成和测试,才能将想法转化为可用的材料。