OpenAI时隔六年重启机器人业务：成立OpenAI Robotics，从数字世界走向物理世界

OpenAI进军机器人领域：从数字智能到物理世界的战略跨越 2026年6月，OpenAI CEO Sam Altman宣布成立“OpenAI Robotics”团队，标志着这家以ChatGPT闻名的AI巨头正式进军实体机器人赛道。此次布局并非偶然，而是基于技术、市场与资本的三重驱动：技术质变：多模态大模型（如GPT-5）已具备视觉、语言和推理能力，为机器人提供“通用大脑”；产业爆发：具身智能赛

msbcsdn

296人浏览 · 2026-06-04 21:25:53

msbcsdn · 2026-06-04 21:25:53 发布

当大模型的智力开始溢出屏幕，下一步必然是赋予它一具身体。

2026年6月1日，一条看似普通的招聘推文在科技圈炸开了锅——OpenAI CEO Sam Altman在社交平台正式发布招聘信息，宣告OpenAI进军实体机器人赛道，成立全新团队"OpenAI Robotics"。这标志着这家以ChatGPT闻名全球的AI巨头，在深耕数字世界近七年之后，正式将触角伸向物理世界。

这不是OpenAI第一次涉足机器人领域，但这一次的信号意义远超以往。时隔六年重启，背后是大模型技术的质变、具身智能产业的爆发，以及一个估值8520亿美元、即将IPO的超级独角兽的战略野心。

一、事件概述：Sam Altman的"第二条推文"

6月1日，Sam Altman在其社交平台账号上发布了一条面向全球工程师的招募信息，明确表示OpenAI正在组建"OpenAI Robotics"新团队，开放岗位包括全栈硬件工程师、运营工程师、系统工程师及机器人工程师。

这不是一次试探性的"探索项目"。从岗位设置来看，OpenAI Robotics覆盖了从底层硬件设计到系统集成再到运营落地的完整链条，这意味着OpenAI不是在做研究，而是在做产品。

值得注意的几个关键信息：

团队定位：全新独立团队，非现有研究部门的延伸
招聘范围：全栈硬件、运营、系统、机器人——典型的"从0到1"团队配置
短期方向：协助型机器人（Assistive Robotics）
战略背景：OpenAI当前估值8520亿美元，计划2026年9月IPO；德意志银行预测上市估值可能突破1万亿美元

一条招聘推文，牵出的是一个万亿级公司从"数字智能"向"物理智能"跨越的战略级决策。

二、详细解读：六年轮回，为何此时重启？

2.1 OpenAI的机器人往事：从Roboschool到Dactyl

很多人不知道，OpenAI与机器人的渊源远比ChatGPT更早。

2016年，OpenAI成立了机器人研究团队，这在当时并不令人意外——彼时的AI社区，强化学习+机器人是最热门的方向之一，DeepMind用AlphaGo刚刚震撼世界，Google收购的Boston Dynamics正在展示Atlas的后空翻，而OpenAI选择了一条更"学术"的路径。

2017年，OpenAI推出了Roboschool——一个开源的机器人仿真平台，基于MuJoCo替代品OpenAI Gym构建，旨在让研究者在不需要昂贵物理硬件的情况下训练机器人策略。Roboschool提供了多种机器人环境，包括行走、攀爬、踢球等任务，降低了机器人强化学习研究的门槛。这在当时是极具社区价值的工作，让没有MuJoCo许可的研究者也能参与机器人RL研究。

2017-2018年，OpenAI机器人团队最具标志性的成果诞生——Dactyl。这是一个灵巧机械手系统，能够在仿真中学习操纵魔方，然后将策略迁移（Sim2Real）到物理机械手上完成实际操作。Dactyl的核心技术贡献在于：

域随机化（Domain Randomization）：在仿真中大量随机化物理参数（摩擦力、质量、视觉外观等），使训练出的策略对现实世界的物理不确定性具有鲁棒性
Sim2Real迁移：证明了纯仿真训练的策略可以成功部署到真实物理环境，这对机器人学习领域影响深远
灵巧操作（Dexterous Manipulation）：在此之前，机械手的灵巧操作一直是机器人领域的硬骨头，Dactyl是当时最成功的尝试之一

Dactyl论文发表在2019年的ICML上，至今被引用超过1500次，域随机化方法更是成为Sim2Real领域的标准范式。

2019年，转折来了。OpenAI做出了一个艰难的决定：解散机器人团队，将全部资源集中投入大语言模型的研发。彼时的GPT-2刚刚发布，虽然能力有限，但OpenAI内部已经看到了Scaling Law的曙光。Sam Altman和Ilya Sutskever等人判断，集中火力在大模型上才是最高杠杆的战略选择。

事后来看，这个决策无比正确——GPT-3、GPT-4、ChatGPT相继问世，OpenAI从一家非营利研究机构成长为全球最有价值的AI公司。但Dactyl团队解散时，不少研究人员感到惋惜，认为机器人方向被过早放弃。

如今，六年之后，OpenAI重新回到了起点。但这一次，他们拥有的不再只是强化学习算法，而是能够理解自然语言、进行推理和规划的通用大模型。

2.2 为何现在重启：天时、地利、人和

OpenAI选择在2026年重启机器人业务，不是一时冲动，而是多重因素叠加的必然选择。

天时：大模型能力质变，"大脑"已经准备好了

2019年OpenAI解散机器人团队时，最大的问题是——机器人缺乏一个足够强大的"大脑"。传统的强化学习方法需要为每个任务从头训练策略，Dactyl只是学会了转魔方，换个任务就要重新来过，这种"一任务一模型"的范式完全无法扩展。

而现在，情况发生了根本性变化：

多模态大模型：GPT-4o、GPT-5等模型已经具备视觉理解、语音交互、代码生成能力，可以为机器人提供感知-理解-规划的统一基础
VLA（Vision-Language-Action）范式：Google的RT-2、Physical Intelligence的π0等模型已经证明，大模型可以作为机器人的"通用策略网络"，实现跨任务泛化
长链推理能力：o1/o3系列的推理能力使机器人能够进行多步骤任务规划，而不仅仅是反应式控制

简单说，2019年的瓶颈是"机器人有了手但没有脑子"，2026年的机会是"大脑已经有了，现在需要给它一具身体"。

地利：具身智能产业爆发，资本和市场都已就位

2024-2025年，具身智能赛道经历了一轮爆发式增长：

Figure AI完成6.75亿美元融资，估值26亿美元，与BMW达成工厂部署合作
1X Technologies（OpenAI投资）推出NEO人形机器人，进入家庭场景测试
Physical Intelligence（π0模型开发者）完成4亿美元融资
特斯拉Optimus在工厂内开始执行简单任务
中国市场的智元机器人、银河通用、宇树科技等也纷纷获得大额融资

市场已经验证了具身智能的商业可行性，资本已经铺好了路，OpenAI此时入场，既不是太早（不用独自教育市场），也不是太晚（格局尚未固化）。

人和：IPO前的战略叙事

OpenAI计划2026年9月IPO，当前估值8520亿美元，德意志银行预测上市估值可能突破1万亿美元。对于一个以软件和API为核心业务的公司来说，"只做数字世界的AI"这个故事在IPO路演中缺乏足够想象空间。

但"从数字世界走向物理世界"——这个叙事就完全不同了。物理世界的市场规模是数字世界的数十倍：制造业、物流、医疗、家庭服务……每一个都是万亿级市场。OpenAI Robotics的成立，为IPO估值提供了强有力的增长预期支撑。

2.3 协助型机器人：务实的第一步

OpenAI Robotics短期内押注协助型机器人（Assistive Robotics），这是一个值得仔细分析的战略选择。

什么是协助型机器人？与工业机器人追求高精度高速度不同，协助型机器人的核心特征是：

与人协作：在有人类存在的环境中安全运行
任务灵活：不是执行固定程序，而是能理解指令、适应变化
物理交互：能够操作人类日常使用的物体和工具

协助型机器人的典型应用场景包括：

家庭辅助：帮助老人和残障人士完成日常任务（取物、整理、简单烹饪）
医疗康复：辅助患者进行康复训练、帮助护士搬运病人
办公协作：在办公室环境中完成文件传递、设备操作等杂务
仓储物流：与人类工人协作完成分拣、包装等工作

为什么选择协助型而非全自主？这体现了OpenAI务实的工程思维：

第一，技术可行性。全自主型机器人需要在完全非结构化环境中独立运行，对感知、规划、执行的容错要求极高。协助型机器人有人类在场提供监督和兜底，降低了失败的代价。

第二，数据飞轮。协助型机器人在与人的协作中自然产生交互数据——人类纠正机器人的动作、补充机器人的理解、调整机器人的行为——这些数据可以持续改善模型，形成飞轮效应。

第三，安全边界。机器人安全事故是整个行业的最大风险。协助型场景下，人类始终保持主动权，物理安全风险可控。

第四，商业路径清晰。从协助型起步，积累技术和用户信任，逐步扩大自主范围，这是更稳妥的商业化路径。

从技术实现角度，协助型机器人对OpenAI现有能力的匹配度极高：

自然语言理解：GPT系列的核心能力，用户可以用自然语言下达指令
视觉感知：GPT-4o的多模态能力可直接用于场景理解
任务规划：推理模型的长链规划能力可分解复杂任务
代码生成：机器人动作序列本质上是一种"物理世界的程序"，大模型的代码生成能力可以迁移

2.4 对具身智能产业的影响

OpenAI Robotics的成立，对整个具身智能产业的影响是深远的，至少体现在以下几个维度：

一是验证了"大模型+机器人"路线的确定性

在OpenAI入局之前，行业内对于"大模型是否是机器人的最优路径"仍有争议。传统机器人学派倾向于用显式建模+经典控制，而VLA路线的支持者则认为端到端学习才是终局。OpenAI的入场，以其在GPT系列上的成功背书，实质上为VLA路线投下了最有分量的一票。

二是加速了行业的人才争夺和技术扩散

OpenAI的品牌效应和资金实力将吸引大量顶尖机器人研究人员。但更深远的影响是"溢出效应"——无法加入OpenAI的候选人会流向其他公司，被OpenAI培养出的人才未来也会流动到行业各处，加速整体技术水平的提升。

三是推动Sim2Real技术的标准化

OpenAI从Dactyl时代就深耕Sim2Real，新团队必然会进一步推动仿真到现实的迁移技术。如果OpenAI将部分工具开源（参考Roboschool的先例），将极大降低行业的技术门槛。

四是重塑了"AI公司"的定义边界

在OpenAI之前，"AI公司"和"机器人公司"是两个不同的物种。前者做软件和算法，后者做硬件和系统。OpenAI Robotics的成立打破了这种分野，宣告了"AI公司"可以同时是"机器人公司"——只要AI足够强大，硬件只是另一个部署终端。

三、行业影响：全球具身智能竞赛升级

3.1 对现有玩家的冲击

OpenAI的入局，对不同类型的现有玩家影响各异：

对人形机器人初创公司（Figure、1X、Agility等）：既是威胁也是机遇。威胁在于OpenAI可能直接竞争，尤其是在软件层面可能形成碾压性优势；机遇在于OpenAI的投资生态——1X Technologies已经是OpenAI投资的企业，未来更多合作而非竞争可能是主旋律。

对传统工业机器人巨头（FANUC、ABB、KUKA等）：短期影响有限。这些公司在工业场景的护城河很深，OpenAI短期聚焦协助型机器人，与工业场景的重叠不多。但长期来看，当协助型机器人的能力外溢到工业场景时，传统巨头将面临降维打击。

对中国的具身智能公司：这是一个复杂的信号。一方面，OpenAI的入场证明了赛道的价值，有利于国内公司融资和招人；另一方面，OpenAI在大模型层面的绝对优势意味着国内公司在"大脑"层面仍有显著差距，需要在硬件和场景上寻找差异化。

3.2 供应链与生态效应

机器人产业不仅仅是AI算法，还需要完整的硬件供应链：电机、减速器、传感器、芯片……OpenAI Robotics的成立将带来显著的拉动效应：

传感器需求增长：协助型机器人需要高质量的视觉、触觉、力觉传感器
边缘计算芯片：机器人端侧推理需要高性能低功耗芯片，利好NVIDIA、Qualcomm等
定制化硬件：OpenAI可能自研机器人硬件，催生新的供应链需求

3.3 监管与伦理的提前考量

协助型机器人直接与人类物理交互，安全性和伦理问题不容忽视。OpenAI作为行业领军者，其安全标准和实践将成为行业参考。以下几个问题值得关注：

人机协作安全标准：ISO 15066等现有标准是否足以覆盖AI驱动的协助型机器人？
隐私保护：家庭场景中的机器人需要大量传感器数据，如何保护用户隐私？
责任归属：当协助型机器人造成损害时，责任如何划分？

四、对开发者的意义：新的技术栈和机会窗口

4.1 新的技术栈正在形成

OpenAI Robotics的出现，意味着"具身智能开发"正在从学术研究走向工程实践，对应的技术栈也在逐步成型：

层次	技术组件	代表工作
感知层	多模态感知、3D理解	GPT-4o视觉、3D重建
决策层	任务规划、动作推理	VLA模型、思维链规划
执行层	运动控制、灵巧操作	仿人手、柔性驱动
仿真层	物理仿真、域随机化	MuJoCo、Isaac Sim
部署层	端侧推理、实时系统	ONNX Runtime、TensorRT

对于开发者而言，这意味着需要掌握的技能组合正在从"纯软件"扩展到"软硬结合"。以下方向尤其值得关注：

VLA模型开发：Vision-Language-Action模型是具身智能的核心，需要同时理解计算机视觉、NLP和机器人学。这可能是未来3-5年最热门的研究方向。

Sim2Real工程：如何高效地将仿真中训练的策略迁移到现实世界，是工程落地的关键瓶颈。域随机化、系统辨识、渐进迁移等技术将有大量工程需求。

机器人基础模型微调：类比大语言模型的微调范式，机器人领域也需要"基础模型+场景微调"的工作流。开发者需要掌握如何在特定场景中高效微调通用机器人模型。

多模态数据工程：机器人训练需要视觉、触觉、本体感觉、语言等多模态数据，数据采集、标注、质量控制的工程实践将形成新的专业方向。

4.2 开发者可以做什么准备

如果你是一名开发者，想要在具身智能浪潮中抓住机会，以下建议可能有用：

补齐机器人学基础：如果背景是纯软件，建议系统学习机器人学（推荐Peter Corke的《Robotics, Vision and Control》），理解运动学、动力学、控制理论的基本概念
熟悉仿真工具：MuJoCo、NVIDIA Isaac Sim、PyBullet是当前主流的机器人仿真平台，建议至少精通一个
跟进VLA前沿：关注RT-2、π0、OpenVLA等工作的论文和开源代码，理解当前的技术边界
参与开源社区：LeRobot（Hugging Face）、RoboCasa等项目正在构建开放的机器人数据和工具生态，参与其中可以快速积累经验
关注OpenAI Robotics的开源动态：基于Roboschool和Dactyl的先例，OpenAI有可能开放部分机器人训练工具和仿真环境，第一时间跟进可以获得先发优势

4.3 对AI工程师的启示

对于已经在大模型领域工作的AI工程师，OpenAI Robotics的成立提供了一个重要启示：大模型的下一个主战场是物理世界。

从GPT到Dactyl，再从ChatGPT到OpenAI Robotics，这条技术路线图非常清晰：

纯数字智能 → 多模态数字智能 → 物理世界智能
   (GPT)       (GPT-4o)        (Robotics)

这意味着，掌握大模型技术只是起点，能够将大模型能力"嵌入"物理世界的工程师将是最稀缺的人才。具体来说：

推理优化不再是服务端独有——机器人端侧的实时推理需求更紧迫、约束更严格
RLHF 将演进为 RLEH（Reinforcement Learning from Embodied Human feedback）——人类对物理行为的反馈比文本反馈更丰富、更直觉
安全对齐 从内容安全扩展到物理安全——一个输出不当文本的模型和一个碰撞人类的机器人，后者的后果要严重得多

五、总结：从屏幕走向世界

OpenAI Robotics的成立，不是一次简单的业务扩展，而是AI发展史上的一个标志性时刻。

六年前，OpenAI因为资源有限，在机器人和大模型之间选择了后者。那个选择造就了ChatGPT，改变了世界。六年后，大模型的成功反过来为机器人提供了最关键缺失拼图——一个足够强大的通用"大脑"。

从Dactyl的灵巧手，到Roboschool的开源仿真，再到如今的OpenAI Robotics，OpenAI与机器人的故事走了一个完整的弧线。但这一次，起点完全不同：

2016年的OpenAI：一个资源有限的研究机构，用强化学习训练单任务机器人策略
2026年的OpenAI：一个估值8520亿美元、即将IPO的科技巨头，用通用大模型驱动跨任务机器人系统

协助型机器人的选择体现了工程务实主义——先在人机协作的边界内验证能力，再逐步扩大自主范围。这种渐进式路径，比一步到位的全自主方案更安全、更可控、更可能成功。

对于整个行业，OpenAI的入场意味着具身智能从"前沿探索"正式进入"巨头博弈"阶段。竞争将加速技术进步，但也可能加速行业整合。对于开发者而言，这是一个新的机会窗口——正如2012年深度学习浪潮、2022年大模型浪潮一样，早期进入者将获得最大的职业杠杆。

物理世界比数字世界大得多，也难得多。但正如Sam Altman在招聘推文中所暗示的——当AI的智力已经足够强大，它终将需要一个身体。

而那一天，或许比我们想象的更近。

作者说：写完这篇文章，我最深的感慨不是OpenAI的技术有多强，而是"战略耐心"这件事的长期价值。2019年解散机器人团队，当时被很多人批评为短视。但从结果看，正是那个"痛苦的放弃"让OpenAI集中资源打赢了大模型这场仗，而大模型的胜利又为重返机器人铺平了道路。有时候，后退不是退缩，而是在为更远的跳跃蓄力。当然，如果你是当年Dactyl团队的成员，这段经历可能更像是——"我种的树，别人乘了凉，然后树又被挖回去了"。技术圈的戏剧性，从来不输好莱坞。

魔珐星云具身智能3D数字人开放平台已上线！

电影级数字人，免显卡端渲染SDK，十行代码即可调用，工业级demo免费开源下载！

更多推荐

什么是具身智能底盘？4 类主流 AI 机器人底盘选型｜VLA/ROS2 项目硬件指南

魔珐星云开发社区

具身智能浪潮下的工业变革：制造企业如何布局底层通用底座？

在具身智能技术加速走入工业深水区的今天，选型不仅是一次硬件采购，更是企业数字化基建的战略抉择。面对复杂的非标现场与柔性产线升级，盲目被单一品牌的封闭系统所束缚，往往会为长期的系统扩展埋下数据孤岛的隐患。选择以仙工智能为代表的、在控制器领域占据全球领先市占率的平台型具身智能机器人公司，利用其开放的通用底座、星云生态平台以及支持 VDA 5050 标准的统一调度系统，才是制造企业构建长效、柔性、持续进