雷锋网按:5月18日,全球权威机器视觉算法测评平台KITTI的世界纪录被阿里云刷新。
KITTI算法评测平台由德国卡尔斯鲁厄理工学院和芝加哥丰田技术研究所联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集,可以用于评测目标检测等计算机视觉技术在复杂真实环境下的性能。雷锋网了解到,KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,有大量的微小目标、欠曝和过曝、多种视角变化以及各种遮挡情况。
业内人士曾如此评价该榜单:相比而言,KITTI道路检测样本较少,对于深度学习任务来说极具挑战。
今日,阿里云将其车辆检测的准确率拉升至90.46%。
(阿里巴巴iDST团队以90.46%的准确率夺得KITTI排名第一)
据了解,此次技术突破是由阿里巴巴iDST视觉计算研究员华先胜领导的团队完成。他们提出了基于区域融合决策和上下文相关的多任务深度神经网络,用于复杂场景下的车辆检测任务,重点解决其中多视角,多姿态以及车辆遮挡等问题。
在网络结构设计上,利用反卷积操作提高了小目标的召回率,同时拼接了多层特征以融合低层的局部信息和高层的语义信息,提高了边框定位的准确率。在训练过程中,还借鉴了GAN(生成对抗网络)中的对抗训练模式。
华先胜表示,“现在我们已经将这样的技术集成到阿里云ET当中,并在城市大脑中得以应用。它能够帮助城市大脑准确的看懂车流信息,快速的做出全局性判断”。
以交通治理为例,通过这项技术,城市大脑通过普通摄像头就可以感知复杂路况下车辆的运行状态和轨迹,对这些数据进行实时分析。基于此进行多种智能交通优化。
在阿里云iDST夺魁之前,雷锋网也曾报道过国内AI公司在KITTI中取得的佳绩:去年9月份,图森未来在KITTI数据集中获得目标检测三个单项、目标追踪两个单项、道路分割四个单项,共计九个单项的世界第一。随后在今年2月份,宇视在计算机视觉算法权威测评平台KITTI以三个单项第一、总分第一刷新世界纪录。