当大模型的智力开始溢出屏幕,下一步必然是赋予它一具身体。

2026年6月1日,一条看似普通的招聘推文在科技圈炸开了锅——OpenAI CEO Sam Altman在社交平台正式发布招聘信息,宣告OpenAI进军实体机器人赛道,成立全新团队"OpenAI Robotics"。这标志着这家以ChatGPT闻名全球的AI巨头,在深耕数字世界近七年之后,正式将触角伸向物理世界。

这不是OpenAI第一次涉足机器人领域,但这一次的信号意义远超以往。时隔六年重启,背后是大模型技术的质变、具身智能产业的爆发,以及一个估值8520亿美元、即将IPO的超级独角兽的战略野心。


一、事件概述:Sam Altman的"第二条推文"

6月1日,Sam Altman在其社交平台账号上发布了一条面向全球工程师的招募信息,明确表示OpenAI正在组建"OpenAI Robotics"新团队,开放岗位包括全栈硬件工程师、运营工程师、系统工程师及机器人工程师。

这不是一次试探性的"探索项目"。从岗位设置来看,OpenAI Robotics覆盖了从底层硬件设计到系统集成再到运营落地的完整链条,这意味着OpenAI不是在做研究,而是在做产品。

值得注意的几个关键信息:

  • 团队定位:全新独立团队,非现有研究部门的延伸
  • 招聘范围:全栈硬件、运营、系统、机器人——典型的"从0到1"团队配置
  • 短期方向:协助型机器人(Assistive Robotics)
  • 战略背景:OpenAI当前估值8520亿美元,计划2026年9月IPO;德意志银行预测上市估值可能突破1万亿美元

一条招聘推文,牵出的是一个万亿级公司从"数字智能"向"物理智能"跨越的战略级决策。


二、详细解读:六年轮回,为何此时重启?

2.1 OpenAI的机器人往事:从Roboschool到Dactyl

很多人不知道,OpenAI与机器人的渊源远比ChatGPT更早。

2016年,OpenAI成立了机器人研究团队,这在当时并不令人意外——彼时的AI社区,强化学习+机器人是最热门的方向之一,DeepMind用AlphaGo刚刚震撼世界,Google收购的Boston Dynamics正在展示Atlas的后空翻,而OpenAI选择了一条更"学术"的路径。

2017年,OpenAI推出了Roboschool——一个开源的机器人仿真平台,基于MuJoCo替代品OpenAI Gym构建,旨在让研究者在不需要昂贵物理硬件的情况下训练机器人策略。Roboschool提供了多种机器人环境,包括行走、攀爬、踢球等任务,降低了机器人强化学习研究的门槛。这在当时是极具社区价值的工作,让没有MuJoCo许可的研究者也能参与机器人RL研究。

2017-2018年,OpenAI机器人团队最具标志性的成果诞生——Dactyl。这是一个灵巧机械手系统,能够在仿真中学习操纵魔方,然后将策略迁移(Sim2Real)到物理机械手上完成实际操作。Dactyl的核心技术贡献在于:

  1. 域随机化(Domain Randomization):在仿真中大量随机化物理参数(摩擦力、质量、视觉外观等),使训练出的策略对现实世界的物理不确定性具有鲁棒性
  2. Sim2Real迁移:证明了纯仿真训练的策略可以成功部署到真实物理环境,这对机器人学习领域影响深远
  3. 灵巧操作(Dexterous Manipulation):在此之前,机械手的灵巧操作一直是机器人领域的硬骨头,Dactyl是当时最成功的尝试之一

Dactyl论文发表在2019年的ICML上,至今被引用超过1500次,域随机化方法更是成为Sim2Real领域的标准范式。

2019年,转折来了。OpenAI做出了一个艰难的决定:解散机器人团队,将全部资源集中投入大语言模型的研发。彼时的GPT-2刚刚发布,虽然能力有限,但OpenAI内部已经看到了Scaling Law的曙光。Sam Altman和Ilya Sutskever等人判断,集中火力在大模型上才是最高杠杆的战略选择。

事后来看,这个决策无比正确——GPT-3、GPT-4、ChatGPT相继问世,OpenAI从一家非营利研究机构成长为全球最有价值的AI公司。但Dactyl团队解散时,不少研究人员感到惋惜,认为机器人方向被过早放弃。

如今,六年之后,OpenAI重新回到了起点。但这一次,他们拥有的不再只是强化学习算法,而是能够理解自然语言、进行推理和规划的通用大模型。

2.2 为何现在重启:天时、地利、人和

OpenAI选择在2026年重启机器人业务,不是一时冲动,而是多重因素叠加的必然选择。

天时:大模型能力质变,"大脑"已经准备好了

2019年OpenAI解散机器人团队时,最大的问题是——机器人缺乏一个足够强大的"大脑"。传统的强化学习方法需要为每个任务从头训练策略,Dactyl只是学会了转魔方,换个任务就要重新来过,这种"一任务一模型"的范式完全无法扩展。

而现在,情况发生了根本性变化:

  • 多模态大模型:GPT-4o、GPT-5等模型已经具备视觉理解、语音交互、代码生成能力,可以为机器人提供感知-理解-规划的统一基础
  • VLA(Vision-Language-Action)范式:Google的RT-2、Physical Intelligence的π0等模型已经证明,大模型可以作为机器人的"通用策略网络",实现跨任务泛化
  • 长链推理能力:o1/o3系列的推理能力使机器人能够进行多步骤任务规划,而不仅仅是反应式控制

简单说,2019年的瓶颈是"机器人有了手但没有脑子",2026年的机会是"大脑已经有了,现在需要给它一具身体"。

地利:具身智能产业爆发,资本和市场都已就位

2024-2025年,具身智能赛道经历了一轮爆发式增长:

  • Figure AI完成6.75亿美元融资,估值26亿美元,与BMW达成工厂部署合作
  • 1X Technologies(OpenAI投资)推出NEO人形机器人,进入家庭场景测试
  • Physical Intelligence(π0模型开发者)完成4亿美元融资
  • 特斯拉Optimus在工厂内开始执行简单任务
  • 中国市场的智元机器人、银河通用、宇树科技等也纷纷获得大额融资

市场已经验证了具身智能的商业可行性,资本已经铺好了路,OpenAI此时入场,既不是太早(不用独自教育市场),也不是太晚(格局尚未固化)。

人和:IPO前的战略叙事

OpenAI计划2026年9月IPO,当前估值8520亿美元,德意志银行预测上市估值可能突破1万亿美元。对于一个以软件和API为核心业务的公司来说,"只做数字世界的AI"这个故事在IPO路演中缺乏足够想象空间。

但"从数字世界走向物理世界"——这个叙事就完全不同了。物理世界的市场规模是数字世界的数十倍:制造业、物流、医疗、家庭服务……每一个都是万亿级市场。OpenAI Robotics的成立,为IPO估值提供了强有力的增长预期支撑。

2.3 协助型机器人:务实的第一步

OpenAI Robotics短期内押注协助型机器人(Assistive Robotics),这是一个值得仔细分析的战略选择。

什么是协助型机器人?与工业机器人追求高精度高速度不同,协助型机器人的核心特征是:

  • 与人协作:在有人类存在的环境中安全运行
  • 任务灵活:不是执行固定程序,而是能理解指令、适应变化
  • 物理交互:能够操作人类日常使用的物体和工具

协助型机器人的典型应用场景包括:

  1. 家庭辅助:帮助老人和残障人士完成日常任务(取物、整理、简单烹饪)
  2. 医疗康复:辅助患者进行康复训练、帮助护士搬运病人
  3. 办公协作:在办公室环境中完成文件传递、设备操作等杂务
  4. 仓储物流:与人类工人协作完成分拣、包装等工作

为什么选择协助型而非全自主?这体现了OpenAI务实的工程思维:

第一,技术可行性。全自主型机器人需要在完全非结构化环境中独立运行,对感知、规划、执行的容错要求极高。协助型机器人有人类在场提供监督和兜底,降低了失败的代价。

第二,数据飞轮。协助型机器人在与人的协作中自然产生交互数据——人类纠正机器人的动作、补充机器人的理解、调整机器人的行为——这些数据可以持续改善模型,形成飞轮效应。

第三,安全边界。机器人安全事故是整个行业的最大风险。协助型场景下,人类始终保持主动权,物理安全风险可控。

第四,商业路径清晰。从协助型起步,积累技术和用户信任,逐步扩大自主范围,这是更稳妥的商业化路径。

从技术实现角度,协助型机器人对OpenAI现有能力的匹配度极高:

  • 自然语言理解:GPT系列的核心能力,用户可以用自然语言下达指令
  • 视觉感知:GPT-4o的多模态能力可直接用于场景理解
  • 任务规划:推理模型的长链规划能力可分解复杂任务
  • 代码生成:机器人动作序列本质上是一种"物理世界的程序",大模型的代码生成能力可以迁移

2.4 对具身智能产业的影响

OpenAI Robotics的成立,对整个具身智能产业的影响是深远的,至少体现在以下几个维度:

一是验证了"大模型+机器人"路线的确定性

在OpenAI入局之前,行业内对于"大模型是否是机器人的最优路径"仍有争议。传统机器人学派倾向于用显式建模+经典控制,而VLA路线的支持者则认为端到端学习才是终局。OpenAI的入场,以其在GPT系列上的成功背书,实质上为VLA路线投下了最有分量的一票。

二是加速了行业的人才争夺和技术扩散

OpenAI的品牌效应和资金实力将吸引大量顶尖机器人研究人员。但更深远的影响是"溢出效应"——无法加入OpenAI的候选人会流向其他公司,被OpenAI培养出的人才未来也会流动到行业各处,加速整体技术水平的提升。

三是推动Sim2Real技术的标准化

OpenAI从Dactyl时代就深耕Sim2Real,新团队必然会进一步推动仿真到现实的迁移技术。如果OpenAI将部分工具开源(参考Roboschool的先例),将极大降低行业的技术门槛。

四是重塑了"AI公司"的定义边界

在OpenAI之前,"AI公司"和"机器人公司"是两个不同的物种。前者做软件和算法,后者做硬件和系统。OpenAI Robotics的成立打破了这种分野,宣告了"AI公司"可以同时是"机器人公司"——只要AI足够强大,硬件只是另一个部署终端。


三、行业影响:全球具身智能竞赛升级

3.1 对现有玩家的冲击

OpenAI的入局,对不同类型的现有玩家影响各异:

对人形机器人初创公司(Figure、1X、Agility等):既是威胁也是机遇。威胁在于OpenAI可能直接竞争,尤其是在软件层面可能形成碾压性优势;机遇在于OpenAI的投资生态——1X Technologies已经是OpenAI投资的企业,未来更多合作而非竞争可能是主旋律。

对传统工业机器人巨头(FANUC、ABB、KUKA等):短期影响有限。这些公司在工业场景的护城河很深,OpenAI短期聚焦协助型机器人,与工业场景的重叠不多。但长期来看,当协助型机器人的能力外溢到工业场景时,传统巨头将面临降维打击。

对中国的具身智能公司:这是一个复杂的信号。一方面,OpenAI的入场证明了赛道的价值,有利于国内公司融资和招人;另一方面,OpenAI在大模型层面的绝对优势意味着国内公司在"大脑"层面仍有显著差距,需要在硬件和场景上寻找差异化。

3.2 供应链与生态效应

机器人产业不仅仅是AI算法,还需要完整的硬件供应链:电机、减速器、传感器、芯片……OpenAI Robotics的成立将带来显著的拉动效应:

  • 传感器需求增长:协助型机器人需要高质量的视觉、触觉、力觉传感器
  • 边缘计算芯片:机器人端侧推理需要高性能低功耗芯片,利好NVIDIA、Qualcomm等
  • 定制化硬件:OpenAI可能自研机器人硬件,催生新的供应链需求

3.3 监管与伦理的提前考量

协助型机器人直接与人类物理交互,安全性和伦理问题不容忽视。OpenAI作为行业领军者,其安全标准和实践将成为行业参考。以下几个问题值得关注:

  • 人机协作安全标准:ISO 15066等现有标准是否足以覆盖AI驱动的协助型机器人?
  • 隐私保护:家庭场景中的机器人需要大量传感器数据,如何保护用户隐私?
  • 责任归属:当协助型机器人造成损害时,责任如何划分?

四、对开发者的意义:新的技术栈和机会窗口

4.1 新的技术栈正在形成

OpenAI Robotics的出现,意味着"具身智能开发"正在从学术研究走向工程实践,对应的技术栈也在逐步成型:

层次 技术组件 代表工作
感知层 多模态感知、3D理解 GPT-4o视觉、3D重建
决策层 任务规划、动作推理 VLA模型、思维链规划
执行层 运动控制、灵巧操作 仿人手、柔性驱动
仿真层 物理仿真、域随机化 MuJoCo、Isaac Sim
部署层 端侧推理、实时系统 ONNX Runtime、TensorRT

对于开发者而言,这意味着需要掌握的技能组合正在从"纯软件"扩展到"软硬结合"。以下方向尤其值得关注:

VLA模型开发:Vision-Language-Action模型是具身智能的核心,需要同时理解计算机视觉、NLP和机器人学。这可能是未来3-5年最热门的研究方向。

Sim2Real工程:如何高效地将仿真中训练的策略迁移到现实世界,是工程落地的关键瓶颈。域随机化、系统辨识、渐进迁移等技术将有大量工程需求。

机器人基础模型微调:类比大语言模型的微调范式,机器人领域也需要"基础模型+场景微调"的工作流。开发者需要掌握如何在特定场景中高效微调通用机器人模型。

多模态数据工程:机器人训练需要视觉、触觉、本体感觉、语言等多模态数据,数据采集、标注、质量控制的工程实践将形成新的专业方向。

4.2 开发者可以做什么准备

如果你是一名开发者,想要在具身智能浪潮中抓住机会,以下建议可能有用:

  1. 补齐机器人学基础:如果背景是纯软件,建议系统学习机器人学(推荐Peter Corke的《Robotics, Vision and Control》),理解运动学、动力学、控制理论的基本概念
  2. 熟悉仿真工具:MuJoCo、NVIDIA Isaac Sim、PyBullet是当前主流的机器人仿真平台,建议至少精通一个
  3. 跟进VLA前沿:关注RT-2、π0、OpenVLA等工作的论文和开源代码,理解当前的技术边界
  4. 参与开源社区:LeRobot(Hugging Face)、RoboCasa等项目正在构建开放的机器人数据和工具生态,参与其中可以快速积累经验
  5. 关注OpenAI Robotics的开源动态:基于Roboschool和Dactyl的先例,OpenAI有可能开放部分机器人训练工具和仿真环境,第一时间跟进可以获得先发优势

4.3 对AI工程师的启示

对于已经在大模型领域工作的AI工程师,OpenAI Robotics的成立提供了一个重要启示:大模型的下一个主战场是物理世界

从GPT到Dactyl,再从ChatGPT到OpenAI Robotics,这条技术路线图非常清晰:

纯数字智能 → 多模态数字智能 → 物理世界智能
   (GPT)       (GPT-4o)        (Robotics)

这意味着,掌握大模型技术只是起点,能够将大模型能力"嵌入"物理世界的工程师将是最稀缺的人才。具体来说:

  • 推理优化不再是服务端独有——机器人端侧的实时推理需求更紧迫、约束更严格
  • RLHF 将演进为 RLEH(Reinforcement Learning from Embodied Human feedback)——人类对物理行为的反馈比文本反馈更丰富、更直觉
  • 安全对齐 从内容安全扩展到物理安全——一个输出不当文本的模型和一个碰撞人类的机器人,后者的后果要严重得多

五、总结:从屏幕走向世界

OpenAI Robotics的成立,不是一次简单的业务扩展,而是AI发展史上的一个标志性时刻。

六年前,OpenAI因为资源有限,在机器人和大模型之间选择了后者。那个选择造就了ChatGPT,改变了世界。六年后,大模型的成功反过来为机器人提供了最关键缺失拼图——一个足够强大的通用"大脑"。

从Dactyl的灵巧手,到Roboschool的开源仿真,再到如今的OpenAI Robotics,OpenAI与机器人的故事走了一个完整的弧线。但这一次,起点完全不同:

  • 2016年的OpenAI:一个资源有限的研究机构,用强化学习训练单任务机器人策略
  • 2026年的OpenAI:一个估值8520亿美元、即将IPO的科技巨头,用通用大模型驱动跨任务机器人系统

协助型机器人的选择体现了工程务实主义——先在人机协作的边界内验证能力,再逐步扩大自主范围。这种渐进式路径,比一步到位的全自主方案更安全、更可控、更可能成功。

对于整个行业,OpenAI的入场意味着具身智能从"前沿探索"正式进入"巨头博弈"阶段。竞争将加速技术进步,但也可能加速行业整合。对于开发者而言,这是一个新的机会窗口——正如2012年深度学习浪潮、2022年大模型浪潮一样,早期进入者将获得最大的职业杠杆。

物理世界比数字世界大得多,也难得多。但正如Sam Altman在招聘推文中所暗示的——当AI的智力已经足够强大,它终将需要一个身体。

而那一天,或许比我们想象的更近。


作者说:写完这篇文章,我最深的感慨不是OpenAI的技术有多强,而是"战略耐心"这件事的长期价值。2019年解散机器人团队,当时被很多人批评为短视。但从结果看,正是那个"痛苦的放弃"让OpenAI集中资源打赢了大模型这场仗,而大模型的胜利又为重返机器人铺平了道路。有时候,后退不是退缩,而是在为更远的跳跃蓄力。当然,如果你是当年Dactyl团队的成员,这段经历可能更像是——"我种的树,别人乘了凉,然后树又被挖回去了"。技术圈的戏剧性,从来不输好莱坞。

Logo

电影级数字人,免显卡端渲染SDK,十行代码即可调用,工业级demo免费开源下载!

更多推荐