动物们在田野上驰骋、在树上灵巧地攀爬、在跌倒之前迅速站稳脚跟。
和我们的灵长类表亲一样,人类也可以运用拇指和精细的运动技能来完成一些任务,比如毫不费力地剥开柑橘皮,或者在黑暗的走廊里寻找正确的钥匙。
虽然行走和抓取对许多生物来说是小菜一碟,但机器人在步态移动和灵巧性方面一直不尽人意。
如今,Hwangbo等人在Science Robotics杂志上撰文,报告证明了这样了一件有趣的事:某种机器人软件设计方法需要数据驱动,而这种方法正好能够克服机器人和人工智能研究领域中长期存在的一个挑战,即模拟与现实之间的差距。
几十年来,机器人专家在预测性数学模型(称为经典控制理论)基础上建立软件,以此来引导机器人肢体的行动。然而,这种方法在引导机器人肢体完成行走、攀爬和抓取这些看似简单的问题上却无效。
机器人通常在模拟中开始它的生命。当它的引导软件在虚拟世界中表现良好时,该软件就会被放置在机器人体内,然后随机器人一起进入现实世界。
在现实世界里,机器人难免会不断地遇到难以预测的状况,包括表面摩擦、结构灵活性、振动、传感器延迟以及具有时差的执行器,一般执行器将能量转化为运动指令。
不幸的是,这些状况是不可能事先由数学运算详尽描述的。因此,即使是在模拟中表现出色的机器人,遇到一些看似微小的物理障碍后也会磕磕绊绊,甚至摔倒。
Hwangbo等人将经典控制理论与机器学习技术相结合,研究出一种缩小类似差距的方法。
雷锋网注:【 图片来源:nature 所有者:ETH Zurich/Daniel Winkler 】
首先,该团队设计了一个中型四足机器人的传统数学模型,名为ANYmal(如上图)。
接下来,他们从引导机器人肢体运动的执行器中收集数据。
然后,他们将收集的数据输入被称为神经网络的机器学习系统中,建立第二个模型,而这个模型可以自动预测AMYmal机器人肢体的特殊运动。
最后,该团队将训练好的神经网络插入第一个模型中,并在标准台式计算机上运行混合模型。
混合模拟器比基于分析模型的模拟器速度更快,精准度更高。更重要的是,机器人的运动在混合模拟器中优化之后,转移进机器人体内,并连入现实世界,这时,机器人在现实世界的行动就像在模拟器里一样成功。
这个姗姗来迟的突破终结了看似不可逾越的模拟与现实鸿沟。
Hwangbo等人使用的方法还暗示了机器人领域的另一个重大转变。
混合模型的出现是这一重大转变的第一步。下一步将是彻底淘汰分析模型,取而代之的是机器学习模型,这种模型将由机器人在现实环境中所收集的数据进行训练。
目前,这种称为端到端培训的纯数据方法发展势头迅猛。媒体已报道了一些创新的应用,包括铰接式机器人手臂、多指机械手、无人机,甚至自动驾驶汽车。
机器人专家仍在钻研如何强化计算速度、丰富传感器数据以及提高机器学习算法质量。目前尚不清楚大学是否应该停止教授经典控制理论。
然而,笔者认为这是一个不祥之兆:未来的机器人的行走不再依赖专家,相反,他们可以利用自己身体里的数据进行学习。
当然,不少挑战仍然存在,其中最主要的是可扩展性的挑战。
到目前为止,端到端培训机制仅应用于只有少量执行器的物理机器人之上。执行器越少,描述机器人运动所需的参数就越少,模型就越简单。实现可扩展性的途径可能包括使用更多层次和模块化的机器学习架构。
想要知道端到端控制是否可以扩大到引导拥有数十个执行器的复杂机器,包括人形机器人,以及诸如制造工厂或智能城市(使用数字技术改善市民生活的城市地区)等大型系统,还需要做进一步研究。
另一个挑战是低技术性,高个性化。
对一些研究人员来说,从使用相对简单的数学模型到应用“潘多拉盒子”机器学习系统(其中的内部工作原理未知)的转变,标志着洞察力悄然退场,失控感油然而生。对我来说,看到机器人像孩子一样学会自己走路让我感到心满意足。
Hwangbo等人提出的见解也可以从心灵之谜的角度来考虑。意识一直是人类本性中最古老的谜题之一。
人类对自我意识的定义十分模糊。然而,人们对机器人软件的研究可以让我们深入了解关于人类思维的古老问题。
我们可以推测,自我意识以及由此延伸出来的意识,其核心是我们抽象思考自己的能力的一种表现,即自我模仿。一个人能看得越远,他对未来展望的心理图景就越详细,自我意识能力就越强。
现在,机器人能够学习自我模拟。这一突破不仅实用,可以减轻一些工程的负担,而且,它标志着机器人自主时代的开始。
雷锋网注:本文编译自 nature
雷锋网注:【封面图片来源:网站名nature,所有者:ETH Zurich/Daniel Winkler】