资讯 人工智能
此为临时链接,仅用于文章预览,将在时失效

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

作者:陈淑瑜
2026/06/03 15:47

中国机器人科研团队在国际顶级学术会议上的存在感继续走高。

当地时间 6 月 2 日上午 11 时,IEEE 国际机器人与自动化大会(ICRA 2026)在奥地利维也纳展览中心 A2 厅正式启动 2026 年度最佳论文奖颁奖典礼。作为机器人与自动化领域最具影响力的国际顶级会议之一,ICRA 每年评选的最佳论文通常代表着当年机器人学的前沿技术与重大突破。

本届 ICRA 2026 共收到全球 5088 篇论文投稿,创下大会历史最高纪录,最终 2829 篇论文入选。

大会设置 11 个专项领域最佳论文奖,覆盖机器人学习、医疗机器人、感知、人机交互、自动化、操作与移动、机构设计、多机器人系统、现场服务、规划与控制等全部核心方向。

36 篇论文从近 3000 篇录用论文中脱颖而出进入最终决赛圈,其中至少 12 篇由华人学者担任一作或通讯作者,占比超过三分之一。颁奖典礼横跨 6 月 2 日至 3 日,分为四个场次进行。

一、中国学者杀入超三分之一决赛圈

本届 ICRA 入围论文中,华人学者的参与度达到了历史新高。

从机构分布看,内地高校和研究机构大量出现在入围名单中:清华(FP3、Dexora)、北大(Dexora)、上海交大(Dexora)、香港中文大学(SurgAM)、台湾大学(角平分足部机构)、新加坡国立大学(Bi-Adapt)等均有论文入围。

从数量上看,36 篇入围论文中至少 12 篇由华人学者担任一作或通讯作者,占比超过三分之一。更值得注意的是覆盖面——从基础策略模型(FP3)到手术机器人(SurgAM),从仿人操作(Dexora)到工业自动化(IMR-LLM),中国学者的研究已覆盖了从理论到应用的完整光谱。

Dexora 的 25 位作者名单本身就是一个信号:当中国顶尖机器人实验室愿意放下竞争、联合开源一个 VLA 基础模型时,竞争的粒度正在从“谁的论文更好”转向“谁的生态更强”。

二、从入围名单看机器人学五大风向

风向一:VLA 模型全面渗透操作,从 PPT 走向开源工程

FP3(3D 基础策略模型)和 Dexora(开源双臂 VLA)同时入围,标志着 VLA 已从概念验证进入工程化阶段。FP3 追求通用性(任意物体、任意场景),Dexora 追求可复现性(开源、多机构协作)。两条路线互为补充,共同回答一个问题:VLA 到底能不能走出实验室?

风向二:触觉仿真独立成赛道

ETac(触觉仿真框架)入围自动化奖项,结合 OmniRetarget 和 Bi-Adapt 等操作论文对触觉数据的依赖,可以清晰地看到触觉感知正在从“锦上添花的传感器”升级为“操作策略的必要输入模态”。

当触觉仿真框架开始作为独立论文入围时,这个方向已经完成了从手工调参到系统化研究的范式转换。

风向三:3D 高斯泼溅从 CV 进入机器人学

LR-SGS 和 FindAnything 代表了 3DGS 技术从纯视觉重建向多模态、语义化机器人感知的迁移。

相比 NeRF,3DGS 的实时性优势使其天然适合机器人场景——建图的速度直接影响决策闭环的频率。

可以预见,3DGS 将成为 ICRA 感知方向的“新 NeRF”。

风向四:人形机器人从“能走”到“能干”

OmniRetarget(全身运动生成)和 HITTER(仿人乒乓球)分别从数据和控制两端推动人形机器人的“任务能力”而非“运动能力”。

“交互保持”概念的出现说明,学界已经不再满足于让机器人模仿人类动作的轨迹,而是要求它理解动作背后的任务目的:这是从 kinematic imitation 到 semantic interaction 的代际跨越。

风向五:极端环境感知形成独立方向

Sonar-MASt3R(浑浊水下)、KISS-IMU(无 GPS 惯性定位)、LR-SGS(LiDAR 辅助弱光场景)三者共同指向一个趋势:在视觉失效的环境下实现可靠感知。这满足了“nobody else can do it”的硬需求——自动驾驶、水下作业、灾难搜救等场景没有视觉退化的容错空间。

这个方向的技术壁垒和产业价值都很高,但研究者相对稀缺。

 

三、结语

ICRA 的专项奖体系以 11 个细分领域奖项全面覆盖机器人学核心方向。

当会议的投稿量从 3000 篇涨到 5000 篇,从 12 个 track 扩展到数十个子领域,用少数几个奖项去涵盖整个机器人学确实不现实。11 个专项奖各归其位,竞争激烈程度因领域而异,这种不均衡恰恰折射出各子领域的差异化发展节奏。

36 篇入围论文中至少 12 篇来自华人学者,占比超过三分之一,这个数字本身就是中国机器人学厚积薄发的最好注脚。从基础模型(FP3)到手术机器人(SurgAM),从开源 VLA(Dexora)到工业自动化(IMR-LLM),覆盖面的广度比数量的增长更值得关注。

雷峰网在此恭喜各个团队获得ICRA奖项,也衷心祝愿华人学者们在此道越走越远,星光不问赶路人,时光不负有心人。

 

四、附录:11 大奖项入围论文一览

1. Best Paper Award on Robot Learning(机器人学习)

入围 4 篇,聚焦扩散策略、3D 基础模型与 VLM 的机器人应用。

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

GRITS: A Spillage-Aware Guided Diffusion Policy for Robot Food Scooping Tasks

作者:Yen-Ling Tai, Yi-Ru Yang, Kuan-Ting Yu, Yu-Wei Chao, Yi-Ting Chen

将扩散策略引入机器人取食任务,核心创新是溢出感知(spillage-aware)机制——抓取策略不仅追求成功率,更关注操作过程中液体或颗粒的泼洒控制。这项工作触及了机器人操作从实验室走向真实厨房的关键瓶颈:操作精度不等于任务完成质量。

FP3: A 3D Foundation Policy for Robotic Manipulation

作者:Rujia Yang, Geng Chen, Chuan Wen, Yang Gao(清华大学)

提出首个面向机器人操作的 3D 基础策略模型(3D Foundation Policy),将大模型范式引入操作策略空间。这是当前 VLA(Vision-Language-Action)路线向 3D 空间延伸的代表性工作,与清华高阳团队此前在具身智能领域的布局一脉相承。

Hierarchical DLO Routing with Reinforcement Learning and In-Context Vision-Language Models

作者:Mingen Li, Houjian Yu, Yixuan Huang, Youngjin Hong, Hantao Ye, Changhyun Choi

将强化学习与上下文视觉语言模型结合,解决可变形线性物体(如线缆)的路径规划问题,是软体操作方向的代表性进展。

Do You Know Where Your Camera Is? View-Invariant Policy Learning with Camera Conditioning

作者:Tianchong Jiang, Jingtian Ji, Xiangshan Tan, Jiading Fang, Anand Bhattad, Vitor Guizilini, Matthew Walter

将相机姿态作为策略学习的条件变量,使策略在不同相机设置间实现泛化。来自 TRI 的合作背景表明该工作有明确的自动驾驶和工业机器人落地指向。

 

2. Best Paper Award in Medical Robotics(医疗机器人)

入围 4 篇,覆盖手术控制、显微手术、场景理解和支气管镜导航。医疗机器人是近年 ICRA 增长最快的子领域之一。

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

RCM Constraint-Consistent Dynamic Control in Surgical Robots

作者:Yu Li, Hamid Sadeghian, Zewen Yang, Valentin Le Mesle, Sami Haddadin

提出远程运动中心(RCM)约束一致性动态控制方法,解决微创手术中器械绕固定切口点运动的精确控制问题。慕尼黑工大 Haddadin 课题组在安全机器人领域有深厚积累,这篇工作延续了其将控制理论应用于手术场景的技术路线。

One-Shot Autofocus Via User-Adaptive Gaze Control for Robot-Assisted Microsurgery

作者:Yunfei Luan, Yuxuan Liu, Yuyang Zhuge, Yating Luo, Yao Guo, Guang-Zhong Yang

提出一次性自动对焦方法,通过用户自适应凝视控制实现显微手术辅助。杨广中院士团队在手术机器人领域深耕多年,这项工作将人因工程引入手术机器人控制,是医工结合的代表性工作。

SurgAM: Surgical Affordance Map Prediction with Multimodal Feature Fusion for Robot Autonomy

作者:Lei Song, Yonghao Long, Mengya Xu, Jiayi Geng, Xiuyuan Chen, Qi Dou

用多模态特征融合预测手术可供性地图(Surgical Affordance Map),使机器人能理解手术场景中哪些区域可操作、哪些区域应避开。这是手术机器人从遥操作走向自主化的关键感知能力。

Geometry-Aware Visual Odometry for Bronchoscopic Navigation Via High-Gain Observer Fusion

作者:Mohammadreza Kasaei, Francis Xiatian Zhang, Feng Li, Farshid Alambeigi, Kev Dhaliwal, Mohsen Khadem

通过高增益观测器融合实现几何感知的支气管镜视觉里程计,解决了在狭窄、弱纹理气道内的定位难题。

 

3. Best Paper Award on Robot Perception I(机器人感知 · 第一部分)

本届最特殊的一个奖项——入围仅 1 篇论文。

在 36 篇入围论文中,这是唯一一个单人入围的奖项,意味该工作在评审中获得了几乎一致的认可。

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

作者:Sebastian Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger

提出开放词汇的、以对象为中心的地图构建方法,使机器人能在任意未知环境中探索并识别从未见过的物体。这一方法将视觉基础模型(如 SAM、CLIP)与传统 SLAM 技术深度融合,代表了机器人感知正在从“识别已知物体”走向“理解任意物体”的范式转移。

Leutenegger 是 SLAM 领域的权威学者,Helen Oleynikova 曾在 ETH 从事自主无人机研究,团队的技术积累保证了方法的工程可行性。

 

4. Best Paper Award on Human-Robot Interaction(人机交互)

入围 3 篇,涵盖可解释性、人在回路策略和视障辅助。三篇论文的共同特征是将技术方案与真实用户需求深度绑定。

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

HEXAR: A Hierarchical Explainability Architecture for Robots

作者:Tamlin Love, Ferran Gebelli, Pradip Pramanick, Antonio Andriella, Guillem Alenya, Anais Garrell, Raquel Ros, Silvia Rossi

提出分层可解释性架构,使机器人能根据不同用户群体(儿童、老人、技术专家)提供适配层级的解释。在服务机器人进入家庭和医疗场景的当下,“对不同的人说不同的话”不再只是社交技巧,而是安全性和信任建立的核心能力。

Uncertainty Comes for Free: Human-In-The-Loop Policies with Diffusion Models

作者:Zhanpeng He, Yifeng Cao, Matei Ciocarlie(哥伦比亚大学)

提出扩散模型天然携带不确定性估计的特性,可被用于人在回路决策——无需额外训练或架构修改。Ciocarlie 是哥伦比亚大学机器人操作实验室负责人,该工作在不确定性量化与策略学习的交叉点上提出了一个简洁而有力的主张。

SA-VLM V2: Useful, Comprehensive, and Concise Guidance for Guide-Dog Robots Assisting the Visually Impaired

作者:Woo-han Yun, JaeHo Shin, BeomSu Seo, Jaehong Kim, ByungOk Han(韩国电子通信研究院 ETRI)

导盲机器人的视觉语言模型指引系统 V2 版本,核心优化方向是“有用、全面且简洁”——从炫技回归用户体验。在辅助机器人领域,用户不需要最聪明的模型,需要的是最不会出错的模型。

 

5. Best Paper Award in Automation(自动化)

入围 4 篇,从 LLM 驱动的工业规划到轻量触觉仿真,覆盖自动化从语义层到物理层的完整光谱。

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

IMR-LLM: Industrial Multi-Robot Task Planning and Program Generation using Large Language Models

作者:Xiangyu Su, Juzhan Xu, Oliver van Kaick, Kai Xu, Ruizhen Hu

用大语言模型直接生成工业多机器人任务规划和可执行程序代码,是大模型从“对话机器人”走向“工厂调度员”的标志性尝试。

ETac: A Lightweight and Efficient Tactile Simulation Framework for Learning Dexterous Manipulation

作者:Zhe Xu, Feiyu Zhao, Xiyan Huang, Chenxi Xiao

提出轻量高效的触觉仿真框架 ETac。触觉仿真在 ICRA 2026 的多个奖项中反复出现,说明这一方向正在从“个别实验室的自研工具”走向“社区共用的基础设施”。当一个领域开始出现专门的仿真框架时,它就已经完成了从手工探索到工程化研究的范式转换。

Ro-To-Go! Robust Reactive Control with Signal Temporal Logic

作者:Roland Ilyes, Lara Brudermuller, Nick Hawes, Bruno Lacerda

将信号时序逻辑(STL)用于鲁棒反应式控制,在形式化方法与实际机器人控制之间架设了一座工程桥梁。

LASER: Level-Based Asynchronous Scheduling and Execution Regime for Spatiotemporally Constrained Multi-Robot Timber Manufacturing

作者:Zhenxiang Huang, Lior Skoury, Tim Stark, Aaron Wagner, Hans-Jakob Wagner, Thomas Wortmann, Achim Menges(斯图加特大学)

面向多机器人木材制造提出分层异步调度与执行机制,将多机器人协调从学术问题推进到真实建筑制造场景。斯图加特大学在计算设计与机器人建造领域有世界级的研究积累。

 

6. Best Paper Award on Robot Perception II(机器人感知 · 第二部分)

入围 2 篇,均聚焦自动驾驶场景的感知与定位,但技术路线截然不同——一个向上突破视觉重建精度,一个向下挖掘 IMU 的极限潜力。

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

LR-SGS: Robust LiDAR-Reflectance-Guided Salient Gaussian Splatting for Self-Driving Scene Reconstruction

作者:Ziyu Chen, Fan Zhu, Hui Zhu, Deyi Kong, Xinkai Kuang, Yujia Zhang, Chunmao Jiang

将 3D 高斯泼溅(3D Gaussian Splatting)与 LiDAR 反射率引导结合,实现鲁棒的自驾场景重建。相比于去年 ICRA 还以 NeRF 为主的场景重建赛道,今年 3DGS 的实时性优势使其快速成为机器人感知的新标准工具。

KISS-IMU: Self-Supervised Inertial Odometry with Motion-Balanced Learning and Uncertainty-Aware Inference

作者:Jiwon Choi, Hogyun Kim, Geonmo Yang, Juhui Lee, Younggun Cho

用自监督学习解决惯性里程计问题,提出运动平衡学习与不确定性感知推理。IMU 是自动驾驶传感器堆栈中成本最低的组件,这篇工作在低成本定位方向上有明确的产业应用前景——当视觉和 LiDAR 都失效时,IMU 是最后的防线。

 

7. Best Paper Award on Robot Manipulation and Locomotion(机器人操作与移动)

入围 5 篇,是本届入围数最多的奖项,竞争最为激烈。覆盖双手灵巧 VLA、仿人全身运动迁移、摩擦调制灵巧手、少样本双臂适应和推动操作。

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

Dexora: Open-Source VLA for High-DoF Bimanual Dexterity

作者:Zongzheng Zhang, Jingrui Pang, Zhuo Yang, Kun Li, Minwen Liao, Saining Zhang, Guoxuan Chi, Jinbang Guo, Huan-ang Gao, Modi Shi, Dongyun Ge, Yao Mu, Jiayuan Gu, Rui Chen, Hao Dong, Huazhe Xu, Li Yi, Yixin Zhu, Hang Zhao, Pengwei Wang, Shanghang Zhang, Guocai Yao, Jianyu Chen, Hongyang Li, Hao Zhao

开源的双臂高自由度灵巧操作 VLA 模型。25 位作者来自清华、北大、上交、中科院自动化所等多个中国顶尖机构,是目前中国在操作领域最大规模的协作成果之一。开源策略有助于推动 VLA 模型走出个别实验室的壁垒——如果这条路走通,Dexora 对中国机器人社区的贡献将远不止一篇论文。

OmniRetarget: Interaction-Preserving Data Generation for Humanoid Whole-Body Loco-Manipulation and Scene Interaction

作者:Lujie Yang, Xiaoyu Huang, Zhen Wu, Angjoo Kanazawa, Pieter Abbeel, Carmelo Sferrazza, Karen Liu, Yan Duan, Guanya Shi(UC Berkeley / CMU / Stanford)

提出交互保持的人形机器人全身运动数据生成方法。一个值得注意的信号是 Pieter Abbeel 和 Angjoo Kanazawa 的参与——前者是模仿学习权威,后者是 3D 人体重建的知名学者——这意味着这项工作站在模仿学习与计算机视觉的交叉点上,是让仿人机器人在复杂场景下完成全身任务的路线图级工作。论文强调“交互保持”(非简单复制人类动作,而是保持任务交互语义),标志着人形运动生成正在从 kinematic imitation 走向 semantic interaction 的代际跨越。

Robotic Dexterous Manipulation Via Anisotropic Friction Modulation Using Passive Rollers

作者:Ethan Fisk, Taeyoon Lee, Shenli Yuan

通过被动滚轮实现各向异性摩擦调制,为灵巧操作提供了一个全新的硬件-控制协同设计范式——不改变控制器,而是改变手指表面的物理属性。

Bi-Adapt: Few-Shot Bimanual Adaptation for Novel Categories of 3D Objects Via Semantic Correspondence

作者:Jinxian Zhou, Ruihai Wu, Yiwei Liu, Checheng Yu, Xunzhe Zhou, Yiwen Hou, Licheng Zhong, Lin Shao(新加坡国立大学)

通过语义对应实现新类别 3D 物体的少样本双臂适应。邵林团队去年在同一奖项中获得最佳论文奖,今年再次入围,展现出在操作领域的持续竞争力。

Push Anything: Single and Multi-Object Pushing from First Sight with Contact-Implicit MPC

作者:Hien Bui, Yufeiyang Gao, Haoran Yang, Eric Cui, Siddhant Mody, Brian Acosta, Thomas Stephen Felix, Bibit Bianchini, Michael Posa(宾夕法尼亚大学)

实现首次见到即推动任意单个或多个物体的接触隐式 MPC 方法。Posa 课题组在接触丰富操作(contact-rich manipulation)的控制理论方面是世界顶级团队,这项工作将接触隐式 MPC 推向了“见到就推”的泛化水平。

 

8. Best Paper Award on Mechanisms and Design(机构与设计)

入围 4 篇,从腿轮变换到 3D 打印义肢,从滚动动力学到仿生鱼。机构设计是 ICRA 中最具工程美感的类别。

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

DigiArm: An Anthropomorphic 3D-Printed Prosthetic Hand with Enhanced Dexterity for Typing Tasks

作者:Dean Zadok, Tom Naamani, Yuval Bar-Ratson, Elisha Barash, Oren Salzman, Alon Wolf, Alexander Bronstein, Nili Krausz(以色列理工学院 Technion)

三维打印的拟人义肢手,专门优化了打字任务的灵巧度。多数义肢研究追求通用抓取,DigiArm 反其道而行之,专注单一高频任务。这种“深度优于广度”的设计哲学在辅助设备领域可能比万能方案更实用——一个打字流畅的义肢,比一个什么都能抓但什么都抓不好的义肢更能改变用户的生活。

Design and Implementation of an Angle-Bisecting Foot Mechanism for a Leg-Wheel Transformable Robot

作者:Hsing-Chen Lee, Wei-Shun Yu, Pei-Chun Lin(台湾大学)

为腿轮变换机器人设计角平分足部机构,解决了单一机构在行走和滚动两种模式间的机械耦合难题。

Relaxation Dynamics in Oblate Spherical Rolling Robots

作者:Micah Oevermann, Robert Ambrose

研究扁球形滚动机器人的松弛动力学,为非传统形状机器人的运动控制提供了理论基础。在机构设计领域,“理解形状如何影响动力学”比“设计更复杂的形状”更具基础价值。

A Novel Bio-Inspired Fish Robot with Tunable Stiffness Via Particle Jamming

作者:Jack Stonecipher, Allen Gao, Wei Wang

通过颗粒堵塞(particle jamming)实现刚度可调的仿生鱼机器人。颗粒堵塞是软体机器人中的经典技术,但将其用于水下推进的刚度调节是一个巧妙的应用创新。

 

9. Best Paper Award on Multi-Robot Systems(多机器人系统)

入围 3 篇,从多无人机悬挂负载到分布式建图。

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

A Distributed Gaussian Process Model for Multi-Robot Mapping

作者:Seth Nabarro, Mark van der Wilk, Andrew J Davison(帝国理工学院)

提出分布式高斯过程模型用于多机器人建图。Andrew Davison 是 SLAM 领域的奠基人之一,他的参与使这篇工作在理论深度上有了充分背书。将高斯过程的数学优雅性与多机器人系统的分布式需求结合,是理论与工程相互成就的典范。

Dynamics Modeling of a Multi-UAV Slung Load System Using a Discrete-Link Cable Approach

作者:Harvey Merton, Ian Hunter

用离散连杆缆绳方法为多无人机悬挂负载系统建模。

Optimal Multi-Robot Planning for Simultaneous Area and Line Coverage

作者:Tianyuan Zheng, Kaiyan Yu, Mingyang Gao, Jingang Yi

实现区域与线状覆盖同时进行的最优多机器人规划。

 

10. Best Paper Award in Field and Service(现场与服务)

入围 3 篇,从飞行器拦截到视障导航再到水下声光融合,共同特点是极端或非结构化环境中的可靠感知与控制。

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

Sonar-MASt3R: Real-Time Opti-Acoustic Fusion in Turbid, Unstructured Environments

作者:Amy Phung, Richard Camilli(MIT / 伍兹霍尔海洋研究所 WHOI)

在浑浊水下环境中实现实时光学-声学融合感知。水下环境对视觉的挑战是机器人感知的极限测试场——在浑浊水中,视觉退化到近乎失明,声学成为唯一可靠的信息源。MIT-WHOI 联合项目在这个方向上的积累代表了目前水下感知的前沿水平。

GuideTWSI: A Diverse Tactile Walking Surface Indicator Dataset from Synthetic and Real-World Images for Blind and Low-Vision Navigation

作者:Hochul Hwang, Soowan Yang, Nhat Hong Anh Nguyen, Parth Goel, Krisha Adhikari, Sunghoon Ivan Lee, Joydeep Biswas, Nicholas Giudice, Donghyun Kim

从合成与真实世界图像构建多样化触觉步行地面指示器数据集,直接服务于盲人与低视力人群的导航需求。

Planar-Sector LOS Guidance for Interception of Agile Targets with Lifting-Wing Quadcopters

作者:Linkai Liu, Kun Yang, Han Zou, Chen Min, Shuli Lv, Shuai Wang, Quan Quan

提出平面扇区视线制导方法,实现升力翼四旋翼对敏捷目标的拦截。

 

11. Best Paper Award on Planning and Control(规划与控制)

入围 3 篇,涵盖仿人乒乓球、符号-技能协同和主动推理驱动操作。

ICRA 2026十一大专项奖揭晓:36篇入围,中国学者杀入超三分之一决赛圈

HITTER: A HumanoId Table TEnnis Robot Via Hierarchical Planning and Learning

作者:Zhi Su, Bike Zhang, Nima Abraham Rahmanian, Yuman Gao, Qiayuan Liao, Caitlin Regan, Koushil Sreenath, Shankar Sastry(UC Berkeley)

仿人乒乓球机器人,分层规划与学习结合。乒乓球是检验仿人机器人高速动态交互能力的经典靶场——需要毫秒级的感知-决策-执行闭环。Koushil Sreenath 和 Shankar Sastry 两位控制领域权威学者的联名,使这项工作具有极高的技术可信度。

SymSkill: Symbol and Skill Co-Invention for Data-Efficient and Reactive Long-Horizon Manipulation

作者:Yifei Shao, Yuchen Zheng, Sunan Sun, Pratik Chaudhari, Vijay Kumar, Nadia Figueroa(宾夕法尼亚大学)

提出符号与技能协同发明机制,实现数据高效且反应式的长时域操作。Vijay Kumar 是无人机和多机器人领域的权威,Figueroa 在人机协作方面有深厚的积累。这项工作试图打通符号推理和运动技能之间的鸿沟——这是让机器人执行“把桌上的杯子放到洗碗机里”这类长序列家用任务的核心挑战。

ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation

作者:Zhuoyun Zhong, Seyedali Golestaneh, Constantinos Chamzas

通过主动学习与残差物理实现非抓取式操作(如推动物体)的推理与规划。

雷峰网(公众号:雷峰网) 

 

长按图片保存图片,分享给好友或朋友圈

正在生成分享图...

取消
相关文章