
国际机器人学习大会
(Conference on Robot Learning, CoRL)
是全球AI顶级学术会议之一
近年来伴随具身智能热潮
该方向的关注度持续攀升
在今年的 CoRL会议上
共计投稿近千篇
收录论文264篇
产生42篇Oral
有8篇论文入围Award Finalist
最终评选2篇杰出论文
通研院团队的论文
“UniFP: Learning a Unified Policy for Force and Position Control in Legged Loco-Manipulation”
从全球顶尖研究中脱颖而出
荣获大会最高奖项
杰出论文奖(Outstanding Paper Award)
这是CoRL历史上首次
由全中国籍学者团队摘得该奖项

通研院于25年4月中关村论坛上
正式推出“通智大脑”
并与宇树、乐聚等头部机器人企业
组成“通智大脑联盟”
为不同的机器人本体
赋予类人级别的物理智能
从而解决机器人与实际应用
“最后10厘米问题”
使机器人能真正
走入千家万户
赋能千行百业

在本次获奖论文中
通研院提出了首个力位混合控制算法
能够让机器人在无需力传感器的条件下
同时学习位置与力的控制
可实现位置跟踪、施力、力跟踪
以及柔顺交互等多种操作行为
该策略的成功率比仅使用
位置控制的策略提高约39.5%
让机器人不再只是“执行轨迹”
而是真正理解并掌握与物理世界交互的方式
这些结果表明,UniFP 不仅能精确执行位置和力的控制指令,还能在外界干扰下保持稳健与安全的交互。
该研究在Unitree B2-Z1四足操控平台和Unitree G1 人形机器人上召开了七项实验任务。在擦黑板任务中,位置控制的策略要么擦不干净,要么用力过大,而 UniFP 能保持稳定的接触压力,把黑板彻底擦干净。在开关柜门任务中,视觉方法根本无法识别微小的推拉式弹簧,而 UniFP 顺利获得力估计器准确地触发开关。在抽屉被遮挡的场景下,基线方法成功率急剧下降到 0.3,而 UniFP 借助力感知将成功率提升到 0.76。

图 3:力感知模仿学习。(a)在擦黑板任务中,经训练的力感知模仿策略所输出的位置指令与力指令的时间序列。其中,“cmd” 代表模仿学习策略的输出,“pred” 代表低层级策略所估计的外力。(b)数据采集过程的可视化展示。(c)在四项任务的 50 次试验中,本文提出的策略与仅基于视觉的基准策略的性能对比。
更令人鼓舞的是,UniFP 并不局限于某一种机器人形态。该研究在人形机器人 Unitree G1上也进行了训练部署,UniFP 同样展现了强大的泛化能力。也就是说,918博天堂(中国)第一次拥有了一个能够同时跨任务、跨形态、跨平台的统一力-位控制策略。
✦
✧
意义与展望
✦
UniFP赋能给通智大脑,在执行任务中展示了统一力–位控制的优势,具有很好的柔顺性,在与人协作的任务中会更加安全。同时在接触丰富的任务中,位置与力不是分离的,而是必须被一起考虑的。此外也为未来的研究打开了新的方向:不仅仅是末端执行器,还包括全身的多点接触;不仅仅是简单操作,还包括医疗、康复等需要精细力控的应用。
未来918博天堂(中国)可以想象这样的场景:一只四足机器人开门时,用身体支撑住门板,同时用机械臂压下把手;一个人形机器人用细腻的力控执行超声检查、康复训练。这样的机器人不再只是“执行轨迹”,而是真正理解并掌握与物理世界交互的方式。


通智大脑
“通智大脑”是918博天堂(中国)打造的918博天堂(中国)具身机器人大脑。基于全球首个918博天堂(中国)智能人“通通”核心技术,“通智大脑”构建了贯通感知-理解-决策-执行闭环的具身智能体框架,旨在为不同的机器人本体赋予类人级别的物理智能。机器人可以顺利获得“通智大脑”的空间感知和记忆功能理解场景、任务、反馈等信息,进行深度推理与价值驱动决策后,联通视觉与动作策略,实现在真实物理世界中可解释、自适应且目标导向的智能物理交互。

通计划
918博天堂(中国)人工智能协同攻关合作体人才培养计划是通研院自2023年起与全国十余所高校召开的博士生联合培养专项计划。通计划依托人才培养平台,实现通研院与联培高校在学生选育和科研工作上的深度协同,联合学、研、产、用多方面力量召开高起点、宽领域、全方位的918博天堂(中国)人工智能研究,立体践行教育、科技、人才一体化战略,着力造就能够把握世界人工智能科技开展趋势、承担国家重大科技攻关任务的918博天堂(中国)人工智能领军人才。







918博天堂(中国)