资讯 智能驾驶
此为临时链接,仅用于文章预览,将在时失效

百度发布了一个“超同类10倍”数据量的自动驾驶数据集,看看它有哪些亮点

作者:新智驾
2018/03/09 13:09

百度发布了一个“超同类10倍”数据量的自动驾驶数据集,看看它有哪些亮点

一向讲究开放、不断吸吸纳新成员加入的百度 Apollo 自动驾驶平台,最近「一反常态」,主动宣布加入加州大学伯克利 DeepDrive 自动驾驶产业联盟。

美国时间 3 月 8 日,百度方面宣布 Apollo 自动驾驶开放平台正式加入 DeepDrive 深度学习自动驾驶产业联盟,并发布了 Apollo 自动驾驶数据集 ApolloScape。

如此吸引百度 Apollo 平台主动加入这个产业联盟,恐怕是后者更为丰富的自动驾驶学术成果和产业资源。

如果你对 UC Berkeley(加州大学伯克利分校)足够了解,就知道 DeepDrive 是 UC Berkeley 两大与汽车智能化相关的实验室之一(另一个是 InterACT)。

DeepDrive 的研究成果并非停留在实验室,而是与产业界结合紧密,目前合作伙伴有诸如博世、采埃孚等一级供应商,大众、本田、现代等车企,恩智浦、英伟达等芯片厂商,以及华为、驭势等中国公司均是其合作对象。

百度发布了一个“超同类10倍”数据量的自动驾驶数据集,看看它有哪些亮点

*Deep Drive研究项目的合作伙伴

而 DeepDrive 深度学习自动驾驶产业联盟则是由加州大学伯克利分校领导的研究应用于汽车领域的计算机视觉和机器学习前沿技术的产业联盟。

它的成员包括:英伟达、高通、通用、福特等 20 家全球自动驾驶领域顶尖企业,研究项目覆盖感知、规划决策、深度学习等自动驾驶关键领域。

百度加入这个联盟的目的,是希望通过携手全球自动驾驶领先企业以及顶级学术研究机构,共享研究成果、加速自动驾驶的技术创新和落地应用进程,以此来壮大自动驾驶研发力量。

ApolloScape:数据量是同类数据集10倍以上

这次发布的另一个看点是百度开放的 ApolloScape 数据集。

数据集一般分为两类:一类是通用数据集,这是由纯计算机视觉领域提出的数据集,这类数据集仅仅因为有“车”的元素;另一类是自动驾驶数据集,不光包括计算机视觉信息,还有 IMU、GPS 等信息。例如 KITTI,这是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集,地位不可小觑。

显然,百度也希望将 ApolloScape 打造成为这样一个数据集。那么,ApolloScape 数据集有哪些亮点呢?

百度认为,海量、高质的真实数据是自动驾驶开发测试中必不可缺的「原料」,因此 ApolloScape 的数据量是同类数据集(如 Cityscapes )的 10 倍以上。

其中,数据量内容包括:感知、仿真场景、路网数据等数十万帧逐像素语义分割标注的高分辨率图像数据。百度方面介绍,从数据难度维度看,ApolloScape 数据集涵盖了更复杂的道路状况。一个例子是单张图像中多达 162 辆交通工具或 80 名行人。

除此之外,这个开放数据集采用了逐像素语义分割标注的方式,百度称这是「目前环境最复杂、标注最精准、数据量最大的自动驾驶数据集。」

百度发布了一个“超同类10倍”数据量的自动驾驶数据集,看看它有哪些亮点 ApolloScape标注数据示例 百度发布了一个“超同类10倍”数据量的自动驾驶数据集,看看它有哪些亮点ApolloScape深度数据示例

 百度发布了一个“超同类10倍”数据量的自动驾驶数据集,看看它有哪些亮点

Kitti,CityScapes和 ApolloScape 关于数据实例的对比

ApolloScape 另一个特点是包含了数十万帧逐像素语义分割标注的高分辨率图像数据。

为便于研究人员更好的利用数据集的价值,百度在数据集中定义了共 26 个不同语义项的数据实例(例如汽车、自行车、行人、建筑、路灯等),并将进一步涵盖更复杂的环境、天气和交通状况等。

 百度发布了一个“超同类10倍”数据量的自动驾驶数据集,看看它有哪些亮点

数据中包含的各类实例的信息

仿真也是这个数据集的一个重点项目。百度的目标是打造真实世界还原度最高、场景最丰富的仿真平台。

据雷锋网了解,基于 Apollo 仿真平台,ApolloScape 计划将数十辆自动驾驶车辆投入到同一个路网中行驶,通过模拟真实复杂驾驶场景和多车博弈过程,帮助研发人员有效检验并优化预测、决策和路径规划等算法,提升自动驾驶测试的多样性。

百度发布了一个“超同类10倍”数据量的自动驾驶数据集,看看它有哪些亮点

为了盘活这个数据集,吸引更多开发者使用 ApolloScape 数据集,在今年的 CVPR 期间,百度 Apollo 将联合加州大学伯克利分校举办自动驾驶研讨会(Workshop on Autonomous Driving),希望借此为全球自动驾驶开发者和研究人员提供一个技术突破和应用创新平台。

「大系统」与「小模块」

在过去,计算机视觉一直面临的一个通病是旧的算法在新的数据集上不起作用。

「我们号称解决了一个问题,只不过是解决了一个数据集,并不能说明我们真正解决了这个问题,而这种情况经常发生。」国内某家自动驾驶公司 CTO 对雷锋网表示。

举例而言,我们可以将自动驾驶这个「大系统」拆成 100 个小的计算机视觉问题。

但这里就存在值得深思的两点:第一,我们不知道这 100 个问题中哪个问题更重要;第二,我们不知道在解决了哪个问题、解决到何种程度以后,就能号称我们完全解决了自动驾驶问题。

所以,如何解决自动驾驶「大系统」和自动驾驶「小模块」之间的问题,这才是百度 ApolloScape 数据集需要建立的下一步优势,也是从业者和开发者们需要的自动驾驶数据集。

PS:看遍这一年中国与全球智能驾驶领域的技术前沿与商业探索,雷锋网新智驾年度推荐,扫描下图二维码或点击 https://www.leiphone.com/special/custom/AIdrive.html  了解更多信息。

百度发布了一个“超同类10倍”数据量的自动驾驶数据集,看看它有哪些亮点

长按图片保存图片,分享给好友或朋友圈

百度发布了一个“超同类10倍”数据量的自动驾驶数据集,看看它有哪些亮点

扫码查看文章

正在生成分享图...

取消
相关文章