2016年8月13日的CCF·GAIR全球人工智能与机器人峰会后,大疆创新副总裁王帆和包括雷锋网在内多家媒体做了分享。
“未来,我们还要做得更加精细,更加精准,就是要把99%变成99.9%,这就是工匠精神。”——大疆创新副总裁王帆
在近两个小时的对话中,这是王帆给我印象最深刻的一句话,大疆仍然保留着它专注技术的基因,脚踏实地的态度和追求极致的信念。
大疆精灵4
工匠精神,究竟是如何体现在大疆的产品上的呢?
王帆:“我们最引以为傲的是室内外复杂条件下的精准悬停技术。”
“悬停”是多旋翼无人机最基本的能力,三维位置、三维角度、三维速度、三维加速度、三维角速度,这十五个需要测量的状态都对多旋翼无人机保持稳定飞行有至关重要的作用。
控制器通过一系列“串级控制”来调整飞行姿态:已知三维位置并始终锁定在悬停位置,这里的控制量是一个目标的悬停速度,当飞行器位于悬停位置时,目标悬停速度为0;当飞行器偏离悬停位置时,目标悬停速度不为0,方向趋于悬停位置。
大疆的组合导航技术结合GPS、惯性测量元件、地磁指南针和气压计各自的优缺点,通过处理电子信号、融合多种传感器的测量值,获得较为准确的飞行器十五个状态量的测量。
王帆:“大疆精灵4的Active track功能,也叫作智能跟随,通过图像识别和机器学习,真正实现了视觉追踪。”
大疆在精灵4上实现了双目立体视觉系统加惯性测量元件构成的视觉里程计,这是一种算法非常复杂的视觉感知系统,不仅要通过图像反推出视野中物体的平面运动,还要反推出这些物体的三维位置,并且基于这些物体的三维位置做多次优化计算。
但是,采用类似人眼结构的双目立体视觉系统,这点就比较容易实现。因为一个物体同时出现在左右两个相机的视野中时,左右视野有视差,视差可以帮助解算物体的位置,只需要简单的几何关系就可以解决,这类技术已经非常成熟。
底部双目立体视觉系统
类似于视觉追踪的功能其实在大疆之前的产品之中就具备,但是当时仅仅是设定GPS点之后,环绕该点进行飞行。大疆在精灵4上真正实现了基于画面识别技术的跟踪,而且全程有自动避障。
王帆:“从室内,到室外,无缝对接,我们的产品不会产生任何偏移,这才是基本的、关键的、核心的,而不是其他花哨的功能。”
精灵4有两套双目立体视觉系统,一套向前看,一套向下看。这样的设计有两个好处:1. 向下看的一套双目立体视觉系统可以探测下方地面上物体的三维位置,从而知道地面的距离;2. 向前看的一套双目立体视觉系统可以用来探测前方场景中物体的深度,产生深度图进行障碍感知。
深度图
精灵4上一共有GPS、惯性测量元件、气压计、地磁指南针、超声波模块、双目视觉系统六种传感器。其中双目视觉系统有两套,共4个相机;惯性测量元件有两个,实现双冗余备份;地磁指南针也有两个,同样双冗余。当工作中的惯性测量元件或者地磁指南针受到严重干扰的时候,系统会自动进行备份切换,切换到另一个传感器上。
有了这些传感器以后,组合导航系统升级成为了智能导航系统。智能导航技术极大拓展了飞行器可以活动的空间,当有GPS的时候,系统可以通过GPS为主进行十五个状态量的测量,视觉里程计依然可以继续运作,提供额外的速度和位置的测量值进一步提高精度;GPS信号不好的时候,视觉里程计可以接替GPS为整个系统提供稳定的观测。
王帆:“我们图像数据传输技术帮助广大的航拍爱好者实现他们的创意和想法。”
Lightbridge技术使用可靠的双向图像数据传输,不同于电视广播塔的数据传输形式,该技术有自动纠错并重传等特性,可以最大限度的保证数据的正确性。此项技术毫无疑问是现阶段无人机图传中最先进的,图传延时很小,同时还最大了化传输距离。从技术实现上来讲,正是因为Lightbridge使用的是可靠的双向数据传输的方式,即使飞得远,图像从端到端的延时仍能稳定保持在100-200毫秒左右。
新一代精灵4航拍无人机,它所搭载的相机能拍摄4K/30fps和1080p/120fps视频,实现了慢动作拍摄。镜头8片镜片的设计,94°视角、f/2.8光圈,最近对焦距离降低至1米,与Phantom 3相机镜头相比,畸变降低了36%,色差降低了56%。
在照片质量方面,Phantom精灵4的相机还能以Adobe DNG RAW格式拍摄1200万像素照片,视频与照片两不误。之前界定专业级与消费级航拍无人机的主要标准,也就是成像质量,如今在大疆4上已经跨越。正如官方宣传片所说,大疆提供了一整套完美的航拍解决方案
最后,用王帆的另一句话作结尾,很合适。
王帆:“我们不是一个PPT上的企业。在实现以前,我们不会到处说。”