10 月 27 日-11 月 2 日,在 ICCV 2019 Workshop 举办的 Vision Meets Drone: A Challenge(简称:VisDrone 2019)挑战赛上,云从科技研究院与中科院信息工程研究所葛仕明研究员团队(以下简称「联合研究团队」)获得了 Task3「单目标跟踪挑战(Single Object Tracking, SOT)」冠军。
VisDrone2019 挑战赛
ICCV 2019 国际计算机视觉大会由 IEEE 主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议,属于 CCF A 类会议。
此次 VisDrone 2019(无人机目标检测)挑战赛,要从无人机获取的视觉数据中进行物体检测和跟踪,吸引了来自海内外知名高校、科研机构和企业,包括中科院、清华大学、马里兰大学、伊利诺伊大学厄巴纳-香槟分校、云从科技、三星研究院等近百支队伍参赛。
本届挑战赛包含了四个任务,联合研究团队参加了「任务 3:单目标跟踪挑战」。
VisDrone 2019 数据集由天津大学机器学习与数据挖掘实验室的 AISKYEYE 团队收集,全部基准数据集由无人机捕获,包括 288 个视频片段,总共包括 261908 帧和 10209 个静态图像。
这些帧由 260 多万个常用目标(如行人、汽车、自行车和三轮车)的手动标注框组成。为了让参赛队伍能够更有效地利用数据,数据集还提供了场景可见性、对象类别和遮挡等重要属性。
因此,本届赛题难点诸多。联合研究团队在「任务 3:单目标跟踪挑战」中,不仅要处理训练集、验证集、测试集等大量数据,还要克服数据中的低分辨率、长期遮挡、相机运动模糊等困难。
任务 3:单目标跟踪挑战
处理方案
经过反复训练与测试,联合研究团队最终提出了改进的精确目标状态估计算法:ED-ATOM。方法里面包含两个模块:目标估计和物体分类。
其中,目标估计模块使用 IOU 预测网络、ResNet-18 网络和 ImageNet 等数据集来做预训练,同时使用低光照图像增强算法处理原始数据,离线精调模型后再在线基于跟踪状态的搜索策略改进鲁棒性。
物体分类模块则使用数据增强的方法,进行在线数据扩充,以便于分类模型的可推广性。同时基于跟踪状态的有效搜索策略,改进稳健性。
最终,结合 IE(图像增强)、ED(通过增强数据训练的 IOU 预测网络)、DA(在线数据增强)、LT(长期跟踪)几种方法的 ED-ATOM 算法,取得了最优成绩。
ED-ATOM 算法运用微光图像增强方法实行暗部追踪训练,通过不同方法的测试,确定效果最佳方案;
运用数据扩充方案,在目标外观发生变化的情况下,通过翻转、平移、缩放、仿射、旋转、模糊等增强方法,提高跟踪自适应性;
在面对严重的不在视野和完全遮挡的跟踪情况下,使用长期跟踪方案,可以自适应搜索区域,提高跟踪稳健性。
通过 ED-ATOM 算法,将可以实现在低分辨率、长期遮挡、摄像机运动/运动模糊等情况下的有效可视化,从而达到锁定目标、预判行动等效果。
跟踪分数
据了解,作为人工智能领域的智能服务企业,云从科技在广州、重庆、上海、苏州、成都等地都成立了研发中心,研发人员超过 1000 名,提供了核心技术产品研发能力。同时与各大学、研究院等成立联合实验室,掌握最前沿的核心技术研发能力。
雷锋网 AI 开发者雷锋网雷锋网