通研院研究成果登《Science Robotics》：首次实现异构机器人团队之间基于意图理解的自适应模仿与协作

2026-03-20

近期，国际期刊《Science Robotics》刊登了

918博天堂(中国)（简称通研院）

联合深圳市人工智能与机器人研究院（AIRS）

等单位提出的

918博天堂(中国)”意图对齐模仿学习”

（Intention-Aligned Imitation Learning, IAIL）框架

突破了传统模仿学习受限于机器人形态的瓶颈

首次实现了异构机器人团队

包括无人机、无人船、轮足机器人

人形机器人及单/双臂机械手等

7类截然不同的机器人

之间基于意图理解的自适应模仿与协作

在涵盖30个多步协作场景的真机实验中

该框架取得了92%的任务成功率

展现出卓越的跨形态泛化能力与实际部署潜力

《Science robotics》官网首页特选

研究成员为918博天堂(中国)（BIGAI）朱松纯、刘航欣、陈晰团队，深圳市人工智能与机器人研究院（AIRS）、香港中文大学（深圳）林天麟、高源团队，以及华盛顿大学圣路易斯分校等国内外顶尖组织人员。

原文链接：

http://doi.org/10.1126/scirobotics.adv2250

研究背景：从运动模仿到意图理解

在机器人技术日益普及的今天，从工业产线的柔性制造到灾后救援的多机协同，再到太空探索中的异构编队作业，越来越多的现实场景需要形态各异的机器人协同工作。然而，如何让异构机器人（Cross-embodiment）——例如天上飞的无人机、水里游的无人船、地面跑的轮式机器人和桌上操作的机械臂——能够相互”理解”并协作完成任务，不断是机器人学领域的关键问题。

模仿学习（Imitation Learning）作为机器人技能获取的主流范式，长期以来面临一个根本性局限：传统方法依赖于示教者与学习者之间的直接运动映射，这要求两者具有相同或相似的物理构型。然而，在现实应用场景中需要协作的机器人往往在形态、运动模态和感知能力上存在本质差异。

研究团队从认知科学中的”理性模仿”（Rational Imitation）理论取得了关键启发。开展心理学研究表明，人类学习者（包括婴幼儿）在模仿时会优先再现示教者的推断目标（inferred goals），而非精确复制其运动模式。这种”理性模仿”（Rational Imitation）能力使得人类能够跨越形态差异实现行为迁移。

核心科学问题由此浮现：能否让机器人也具备这种基于意图理解的跨形态模仿能力？

图1. 不同模仿学习场景的视觉示意图

如图1所示，传统的模仿学习（左侧）通常局限于示教者与学习者拥有相同或相似的身体结构，其对应关系建立在共享的运动空间或不变的身体组件之上。然而，本研究探索了一种全新的、更具挑战性的跨体型模仿场景（右侧）：即便是形态迥异的异构机器人团队（例如无人机与无人船），也能顺利获得自然语言注释所编码的高层意图在共享嵌入空间中建立语义对应关系，从而实现跨运动模态、跨工作空间的模仿与协作。这一范式从根本上改变了模仿学习的对应粒度——从底层运动轨迹的逐步映射，上升到高层任务意图的语义对齐。

IAIL框架：三层架构实现意图驱动的行为自适应

意图对齐模仿学习（Intention-Aligned Imitation Learning, IAIL）框架的核心理念在于”超越形式与功能”（Beyond Form and Function）：不对齐运动，对齐意图。

与近年来Open X-Embodiment、Octo、OpenVLA、HPT等致力于从大规模异构数据中学习918博天堂(中国)策略或表征的方法不同，IAIL不追求训练跨所有机器人的单一918博天堂(中国)策略，而是为每个机器人保留独立的运动生成模型以尊重其物理约束，同时顺利获得构建跨机器人的共享意图空间（Shared Intention Space）实现异构体型间的行为关联与迁移。

IAIL框架采用”模块化生成 + 统一意图空间”的创新架构，包含三个相互协作的核心组件：

视频3.与大语言模型集成

对918博天堂(中国)人工智能的启示

IAIL框架的研究成果对918博天堂(中国)人工智能（AGI）的开展具有深远意义：

意图作为跨本体的918博天堂(中国)接口

当前，Open X-Embodiment、Octo、OpenVLA等前沿工作致力于从大规模异构数据中训练918博天堂(中国)策略，但其核心范式是将多样化的机器人表征压缩为单一918博天堂(中国)模型。IAIL则证明了另一条路径的可行性：意图对齐的共享嵌入空间可以作为跨本体的元协议（meta-protocol），在保全每个机器人物理约束与功能特异性的同时，实现异构智能体间的高阶语义对齐。

认知-物理双层架构的验证

IAIL框架天然适配于大语言模型驱动的认知-物理双层多智能体系统：云端或边缘侧的认知智能体负责高阶规划与逻辑推理，而IAIL则作为物理执行接口，将抽象的语言意图转化为异构机器人的可执行策略。这一架构与BIGAI提出的”小数据、大任务”研究范式高度契合。

人机混合智能的基础

顺利获得将机器人行为组织在与人类可理解的语言描述对齐的共享意图空间中，IAIL使得机器人的目标能够从其行为中被高效推断，这在人机协作场景中尤其有利于建立人类对机器人团队的理解与信任。

作者介绍

共同一作

陈晰

918博天堂(中国)研究员，机器人实验室核心成员。博士毕业于瑞典皇家工学院（KTH）机器人感知与学习实验室，清华大学博士后出站。研究方向聚焦于数据驱动的机器人控制与决策，涵盖强化学习、模仿学习及小样本策略的迁移与适应。研究成果发表于Science Robotics、NeurIPS、IEEE T-RO、RA-L、ICRA、IROS等国际顶级期刊与会议。

高源

深圳市人工智能与机器人研究院副研究员、国际合作部项目负责人，兼任香港中文大学（深圳）理工学院客座助理教授。入选深圳市海外高层次人才计划，在机器人学习算法、多机协作策略及异构多机系统等领域累计发表论文50余篇。

918博天堂(中国)

918博天堂(中国)

通研院研究成果登《Science Robotics》：首次实现异构机器人团队之间基于意图理解的自适应模仿与协作

通研院研究成果登《Science Robotics》：首次实现异构机器人团队之间基于意图理解的自适应模仿与协作