雷锋网「新智造」正在启动“新智造成长榜2017”评选活动,雷锋网「新智造」将对人工智能与机器人行业进行大规模报道、梳理和调研,并联合数十家著名投资机构根据这些创新公司的技术实力、商业能力和成长性进行深度评选,最终从多个领域分别选出一些极具潜力成长性的创新公司。如果你想参与雷锋网「新智造」的评选,可点击「报名」链接,或通过邮箱xinzhizao@leiphone.com联系我们!
最近,卡内基梅隆大学机器人专家 Dhiraj Gandhi,Lerrel Pinto 和 Abhinay Gupta 发表了一篇题为《通过坠机学习如何飞行》的论文,在此,不妨让我们来看看这项研究究竟是什么:
模拟世界和现实世界之间的最大差距,其实就是感知问题。绝大多数无人机实验都避免大量使用实际数据,因为现实中无人机坠机情况时有发生!在这篇论文中,我们就“勉为其难”,从收集无人机自己坠机的数据集合入手!我们开发了一款无人机,它只有一个目的,就是撞向物体坠机……我们会使用所有这些坠机数据和相同轨迹采样的正常飞行数据相结合,然后让无人机学习一个简单、且强大的导航策略。
听起来是不是很酷?现在,就让我们开始坠机吧!
在思考如何成功飞行(或是驾驶、步行、以及其他任何形式的运动)时,一个方法就是让无人机不断地出现飞行失败、坠机——就像孩子学习走路时会经常摔倒一样。从这个角度来看,学习飞行最有效的方法,就是通过从摧毁中得到大量经验,这样才能学会如何避免出现坠毁。一旦你可以成功避免碰撞,那么基本上就能知道该如何飞行了,是不是很简单?然而,我们往往不会采用这种学习方式,因为无论是对机器人,还是对人类而言,坠毁通常都是非常糟糕的一种结果。
卡内基梅隆大学的机器人专家则希望另辟蹊径,和过去人们尽可能尝试寻找不去让无人机坠毁的解决方案不同,他们能够从无人机坠毁中找到一条新方法,因此他们研发了一款 AR Drone 2.0 无人机,可以在二十多种室内环境下不断坠毁——短短四十小时的飞行时间中,这款无人机就坠毁了 11.5 万次。正如研究人员所指出的那样:“由于无人机的外壳价格很便宜,而且易于更换,所以即便出现灾难性故障,成本也可以忽略不计。”每次碰撞都是随机的,无人机会在室内空间内的随机位置起飞,然后开始缓慢超前飞行,直到撞上某个物体。之后,它会重新回到起点,然后再选择一个新方向——当然,前提是这款无人机还能继续飞。
在此过程中,无人机的前置摄像机会以 30 Hz 的频率来记录图像。一旦碰撞发生之后,飞行轨迹上的图像就会被分成两部分:一部分是无人机正常飞行的,另一部分则是坠毁一瞬间的图像。这两部分图像集合会被发送给一个深度卷积神经网络,利用人工智能技术来学习、分析给定的拍摄图像,然后判断直线飞行是否是一个好主意。在 11.5 万次碰撞之后,算法所学习到的经验已经能够让无人机自主飞行了,即便是在狭窄、混乱的环境中,无人机也能轻松避开障碍物,甚至是一些毫无明显特征的白色墙壁和玻璃门,无人机也能躲开。不仅如此,控制无人机的算法其实也很简单:它将 AR Drone 无人机的前置摄像头拍摄的图像分割成了左图像和右图像,如果这两个图像中的任意一个看起来比较不容易出现碰撞,那么无人机就会朝那个方向飞行,否则无人机将会继续保持直线飞行。
那么,这种解决方案是否有效呢?坦白说,无人机自主飞行效果肯定没有人类直接操控的那么好,不过在相对比较复杂的环境中,比如狭窄的走廊和布满椅子的走廊里,人类反应往往没有机器算法判断的快。
最后一个显而易见的问题,那就是这种解决方案,是否比传统训练无人机学习飞行的方法更好?毕竟,这种解决方案是教导无人机坠毁,而不是飞行。实际上,现在我们都还不知道答案是什么,但最重要的是,如果允许无人机坠机,那么整个学习过程都可以是自我监督的:就把无人机放到一个房间里,让它自己飞、自己撞、自己坠毁——当然你得去给它更换电池,而除了更换电池之外,你所收集的数据、以及无人机学习过程完全都是自主完成的。另一方面,如果你试图较无人机不要碰撞,那么就必须还得找到一种方法来确保它不会坠毁。当然,你可以通过从人类飞行员身上学习,或是把无人机放置在具有运动捕捉系统以及一些部署 3D 障碍物的环境下飞行,不过所有这些解决方案都会增加大量成本和复杂度。所以,让无人机从坠机中学习飞行,要容易的多。
VIA ieee