雷锋网AI科技评论按:ICRA全称为“IEEE International Conference on Robotics and Automation”(机器人与自动化会议),是机器人技术领域最有影响力的国际学术会议之一。ICRA 2017于5月29日至6月4日举行,雷锋网AI科技评论从新加坡带来一线报道。该会议举办期间,雷锋网将围绕会议议程及获奖论文展开系列专题报道,敬请期待。
认知机器人领域共有四篇入围最佳论文,雷锋网将做逐一介绍。
使用分数空间描述引导任务和运动规划问题的研究
来自麻省理工大学的研究者,Kim, Beomjoon; Kaelbling, Leslie; Lozano-Perez, Tomas提出了一种算法来加速任务和运动规划中的搜索速度。算法针对如何在学习中提高效率的三个不同的挑战:预测什么?如何描述一个规划任务实例?怎样将知识从一个问题实例传递到另一个?我们提出了一种方法。它能基于对规划问题实例的普遍描述,预测搜索空间的约束。这被叫做分数空间。用现有方法的性能来表示这些问题实例。使用这种描述方法,将知识从在分数空间中基于相似性的问题,以约束的形式进行传递。他们设计了一种序列算法,能高效地进行约束预测,并使用三个不同的具有挑战性的任务和运动规划问题进行了评估。结果显示,与无引导规划相比,他们的方法在速度上有了量级上的提高。
原文链接:http://lis.csail.mit.edu/pubs/kim-icra17.pdf
关于部分可观察任务中力反馈表示的研究
触觉是人类最早发展出来的感知系统。它在我们日常与环境交互过程中扮演重要的角色。为了成功完成一项任务,在操作过程中需要引入力反馈。然而,人工设计一个反馈机制极具挑战。来自康奈尔大学的研究者,Sung, Jaeyong; Salisbury, Kenneth; Ashutosh Saxena设想一个操作任务需要引入触觉传感器反馈,以此来修正已有的规划。对于部分可观测任务,他们使用一个新的架构,任务模型是一个部分可观测马尔科夫决策过程(POMDP)。并将力反馈的适当表达作为POMDP模型中的状态进行研究。模型使用循环神经网络进行参数化,使用变分贝叶斯方法优化近似后验。最后,他们建立深度Q学习来选择每个状态下的最优行动,而不使用仿真器。他们使用模型,在PR2机器人进行了多次旋动旋钮直到到位的测试。
原文链接:https://arxiv.org/pdf/1705.06243.pdf
深度多模型嵌入:使用点云、语言和轨迹来操作新的对象
机器人需要根据各种感知形式,比如视觉,语言和运动轨迹才能在真实世界的环境里进行活动。但是,要通过人工设计的方式把这些分散的感知形式联系起来是极具挑战的。来自康奈尔大学的研究者,Sung, Jaeyong; Lenz, Ian; Ashutosh Saxena介绍了一种算法,学习如何将点云,自然语言和操作轨迹等数据通过深度神经网络引入一个共享的嵌入空间。通过他们的网络可以在语义上有意义的空间进行学习。他们使用基于损失的边界将相关的对拉得更近,同时将相关性较低的放得更远。他们同时使用两者在较低层次进行预训练,在最后的嵌入空间进行精调,从而实现更加动态的表达。他们使用这个算法执行操作新的对象和装置的测试。测试中的经验来自于之前在其他对象上的测试。在一个巨大的数据包中,相比于以前的技术,他们在精确性和运行时间上有了显著的进步。他们也在PR2机器人上使用学习到的嵌入空间进行了端到端的试验。
原文链接:https://arxiv.org/pdf/1509.07831.pdf
机器人运动规划的深度视觉预见方法
提高机器人学习技能和环境能力的一个巨大挑战是彻底放弃人类监督。这样机器人可以在不受人类价值反馈的限制下收集它们需要的数据,并提高它们的性能。基于模型的强化学习方法有望使它具有预测自己行为结果的能力。它可以在没有人类监督的情况下,针对各种任务和环境提供一个灵活的可预测模型。来自伯克利的两位研究者,Finn, Chelsea; Levine, Sergey提出一种方法,它把以行动为条件的深度视觉运动模型和可预测模型控制结合起来,完全使用没有经过标签的训练数据。他们的方法并不需要经过校准的相机,经过调试的训练集,或者精确的感知和驱动。结果显示,通过他们的方法可以让机器人完成非抓取操作,推动对象。并且在训练中可以在没有看到对象的情况下操作新的对象。
原文链接:https://arxiv.org/pdf/1610.00696.pdf
相关视频:https://wn.com/deep_visual_foresight_for_planning_robot_motion