无人驾驶数据集 | BDD100K数据集介绍及下载
作者:graviti
发布于 12/8/2020

一、BDD100K数据集介绍

BDD100K(Berkeley DeepDrive 100K):大型多样化驾驶视频数据集

无人驾驶有望改变每个人的生活。然而,最近的一系列无人驾驶事故表明,人类还不清楚一个人造驾驶感知系统如何才能避免一些看起来明显的错误。

加州大学伯克利分校AI研究所(BAIR)致力于探索最前沿的自动驾驶感知算法,使无人驾驶技术更具安全性。为了设计和测试潜在的算法,BAIR希望利用真实驾驶平台收集的数据信息。这些数据需要具备四个主要特征:大规模、多样、基于真实街景以及带有时间信息。其中,数据多样性对于测试感知算法的鲁棒性尤为重要,然而目前的公开数据集只拥有上述一部分特征。为此,BAIR推出BDD100K数据集,该数据集是迄今为止用于计算机视觉研究最大、最多样的开放驾驶视频数据集。

BDD100K由100,000个高清视频序列组成,涵盖一天中许多不同时间、天气条件和驾驶场景下超过1,100小时的驾驶记录,每个视频大约40秒长,清晰度为720p,帧率为30fps。视频序列中还包含GPS位置信息、IMU数据和时间戳。

道路目标检测(Road Object Detection)

  • BDD100K使用2D矩形框共标注了10万张图像,标注对象包括公共汽车、交通灯、交通标志、人、自行车、卡车、汽车、汽车、火车和骑手。
  1. 了解对象的分布及其位置
  2. 比较不同天气条件下或不同类型场景下的对象数量

14

该图表还显示了BDD100K数据集中的不同对象集,以及数据集规模——超过100万辆汽车。BDD100K数据集也适用于研究某些特定的领域。例如,如果您对检测和避开街道上的行人感兴趣,您也可以研究BDD100K数据集,因为它比以往数据集包含更多的行人实例(如下表所示)

15

全帧分割(Full-frame Segmentation)

  • 探索1万+张具有像素级和丰富实例级标注的图像
    BDD100数据集的标签集与CityScapes数据集中的训练标注兼容,能够方便研究数据集之间的域转换。这些标注能帮助我们理解不同类型场景中数据和对象统计的多样性。

16

可行驶区域(Drivable Areas)

  • 从10万张图像中学习复杂的行驶决策
    我们能否在道路上行驶,不仅取决于车道标线和交通设备,还依赖于与共享道路上其他对象的复杂交互。最后,重要的是要哪个区域可以行驶。为了研究这个问题,BAIR根据车辆的轨迹将可驾驶区域分为两类:直接可驾驶和替代可驾驶。

车道标记(Lane Markings)

  • 车道标记是人类驾驶员重要的道路指示;当GPS或地图没有精准地全球覆盖时,车道标记是无人驾驶系统驾驶方向和定位的关键线索
    BAIR根据车道标志对车道上车辆的指示将车道标志分为两种类型:
  1. 垂直车道标志表示沿其车道行驶方向的标志。
  2. 平行车道标志是指供车道上的车辆停车的标志。BAIR还提供标记的属性,例如实线与虚线以及双层与单层。

BDD100K的10万张图像上有多种车道标注可用于驾驶指导。如果您准备使用您的车道标记预测算法,BDD100K便是一个非常明智的选择!(下图为BDD100K与其他车道标记数据集的比较)
17

二、BDD100K数据集下载

针对海外数据获取难、下载慢的问题,Graviti给出了一站式解决方案——将全球资源Host至国内镜像,无需VPN访问即可享受高速下载。

您可以轻松在Graviti下载BDD100K数据集~下载步骤如下:

1、 点击进入Graviti公开数据集-BDD100K主页

image--9-

2、点击「获取数据集」,将BDD100K加入我的公开数据集

2

3、系统自动跳转到GAS控制台-TensorBay-公开数据集后,点击进入「BDD100K

3

4、下载BDD100K数据集

4

三、BDD100K数据集在线可视化

使用Graviti可视化插件,实现在线可视化数据标注分布,所见即所得!

1、 停留在刚才的TensorBay-GAS控制台,点击「数据详情」-「数据可视化」,可查看BDD100K数据样例

5

2、 进入「标注详情」页,点击「详情」-「可视化

6
7

● 标注分布、标签统计一览无余

8

3、 查看标签分布

9

四、BDD100K数据集管理

对于部分Graviti提供的标准格式的公开数据集,支持Fork公开数据集的功能。用户可将公开数据集添加至【我的数据集】,在线进行数据修改与版本管理。

具体步骤如下:

1、在TensorBay-GAS控制台-BDD100K页面,点击「Fork

10

2、进入「我的数据集」,点击「BDD100K」数据集

11

3、进入「数据集详情」页,根据标注标签筛选数据,在线查看标注分布情况

12

4、在Draft(草稿模式)下,可选择上传数据、发布数据集等基本功能,并享受版本管理、在线可视化、数据协同等服务,还通过开发者工具在线集成与云端使用数据

13

● 支持多种格式、多样场景与多种行业的数据托管,原始数据、标注数据与Meta信息在线管理,化繁为简
● 支持原始数据与标注数据的版本管理,轻松的追溯数据的版本迭代过程,无需再为数据改动而烦恼
● 组件式的实时在线数据可视化工具,兼容主流的数据格式与标注数据,多种数据分布查看方式,无需下载与0代码即可掌握数据细节
● 提供SDK、CLI与OpenAPI多种开发工具,完整的文档与使用案例,让您的数据与Pipeline快速集成

分享到:
Start building your AI now