大模型和具身智能是当下AI领域最火赛道:

AI领域顶流:大模型;

AI领域次顶流:具身智能;

概念:

具身智能(Embodied AI):指智能体与物理世界交互,能够在复杂环境中自主学习和适应,理解问题并做出决策和行动,强调“感知-行动回路”;

大模型:具有大量参数的机器学习模型,通过在大量数据上进行训练学习模式和特征,能够处理复杂的数据和任务;

多模态:将数个大模型融合在一起,汇总成一个模型;最终这个模型或系统能够处理多种不同类型的输入数据并融合它们生成输出。

多模态大型模型(MLMs)方面的进步,为具身大模型注入了强大的感知、交互和规划能力,以开发通用的具身智能体和机器人,与虚拟和物理环境进行交互。因此,具身智能体被广泛认为是MLMs的最佳载体。

图片

人形机器人是具身智能体的一种形态,除此之外,比如能在家庭中行驶并与人简单交互的宠物机器人、比如 L4自动驾驶,也都是具身智能智能体;人形机器人目前被业界普遍认为是AGI 最佳载体,是具身智能体最佳形态。

大模型给机器人提供了泛化能力,让具身智能进入新时代,大模型的成熟决定了具身智能的成熟。

关系梳理:

图片

AGI(通用人工智能)起于大语言模型(LLM)、终于具身智能,“机器人+大模型”为AGI走进物理世界提供了更多的可能性。

具身智能领域研究方向可粗略分为:具身大模型(机器人“大脑”)和机器人整机(本体+小脑);其中,大脑负责推理、规划、决策、感知;小脑负责运动控制和协调;本体包括上半身、下本身和传感器、‌执行器等硬件设备,执行指令并高效完成各类任务。

具身智能主要涉及四大板块:具身感知、交互、智能体和仿真;具身智能技术领域具体会涉及到LLM、视觉多模态模型(VLM)、深度强化学习(Deep Reinforcement Learning)、模仿学习(Imitation Learning)、强化学习(Reinforcement Learning)等诸多前沿技术。

全球人形机器人本体公司背景可大体分为:汽车制造企业(特斯拉、小鹏等)、机器人企业(优必选、宇树等)、科研院校孵化(银河通用)和互联网背景创业团队(星尘智能、1X等),目前科研院校教授“兼职”创业占据国内人形本体初创企业半壁江山,国外更多是互联网背景创业团队。

全球具身智能大模型(机器人通用“大脑”)公司背景大体可分为:科技大厂(英伟达、OpenAI等)和科研院校背景创业团队(Physical Intelligence、Skild AI等)。

人工智能和大模型技术突破性发展催生了本身具身智能浪潮,但同时大模型发展瓶颈也同样是人形机器人商业化核心壁垒;相较于上游机器人核心零部件基本成熟,软件算法进步是推动人形机器人功能提升和应用场景拓展的关键;

目前来讲,大脑算法中的环境理解,基于机器视觉,发展相对成熟;智能交互与认知推理,将伴随大模型的迭代而发展;小脑部分发展的制约因素之一是数据采集和精细运动执行尚未有统一的底层算法;数据采集的主要方式:远程操作、仿真合成数据。

接下来小编将以四篇文章,详细介绍具身智能:

  • 具身智能技术拆解(技术篇,共2篇)

  • 具身智能领域,全球科技大厂和初创公司盘点(产品及进展详细介绍)

  • 具身智能领域,全球华人图谱

  • 具身智能方向,全球高校内部实验室汇总

... ... ...

五篇文章已在知识星球发布,扫码加入知识星球“机器人头条”,查看完整版文章,并深度了解“具身智能&人形机器人”赛道

图片

图片

Logo

电影级数字人,免显卡端渲染SDK,十行代码即可调用,工业级demo免费开源下载!

更多推荐