详解Waymo数据集
作者:graviti
发布于 11/30/2020

一、waymo数据集发布方

2016年12月13日, Alphabet宣布将Google的自动驾驶汽车项目从Google中拆分出来,成立为单独运营的子公司Waymo。Waymo这个名字代表的是“A New Way Forward in Mobility”(未来新的移动方式),其使命是让人和物安全快捷地到达目的地,不仅便利交通,更致力于挽救成千上万因交通事故而丧生的生命。

二、waymo公开数据集介绍

为了加快推进机器感知和自动驾驶领域的技术进步,waymo于2019年7月公开了数据集。相比以往自动驾驶领域的数据集,waymo在传感器质量、数据集大小上都有较大的提升。

1.规模和覆盖范围

Waymo数据集共包含1950多个自动驾驶片段,每一片段包含20秒的连续驾驶画面。连续镜头内容可以帮助研究人员开发模型来跟踪和预测其他道路使用者的行为。

2.多样化的驾驶环境

数据采集的范围涵盖美国加州的凤凰城、柯克兰、山景城、旧金山等地区的市中心和郊区,同时涉及了各种驾驶条件下的数据,包括白天、黑夜、黎明、黄昏、雨天和晴天。

3.高分辨率传感器和相机数据

数据集包含来自激光雷达的数据和来自相机的数据。

其中,激光雷达数据包含——一个中距离激光雷达(顶部)和四个短距离激光雷达(前,左侧,右侧和后方)。

外在校准矩阵将激光雷达框架转换为车辆框架。中距离激光雷达具有不均匀的倾斜光束角度模式。一维张量可用于获得每个光束的精确倾斜度。每个激光雷达的点云被编码为距离图像。每个激光雷达提供两个距离图像,两个最强返回率分别提供一个。它有4个频道:

  • 通道0:范围(请参见球坐标系定义)
  • 通道1:激光雷达强度
  • 通道2:激光雷达延伸
  • 通道3:is_in_nlz(1 =输入,-1 =不输入)

激光雷达的伸长率是指脉冲超过其标称宽度的伸长率。例如,具有长脉冲伸长率的回波表示激光反射可能会被拖尾或折射,从而使回波脉冲在时间上变长。除了基本的4个通道外,我们还提供了另外6个通道,用于激光雷达到摄像机的投影。使用的投影方法考虑了卷帘快门的影响:

  • 频道0:摄像机名称
  • 通道1:x(沿图像宽度的轴)
  • 通道2:y(沿图像高度的轴)
  • 频道3:第二次投影的相机名称(如果没有投影,则设置为UNKNOWN)
  • 通道4:x(沿图像宽度的轴)
  • 通道5:y(沿图像高度的轴)

范围图像根据以下规则表示球坐标系中的激光雷达点云:

  • 每行对应一个倾斜度。第0行(图像顶部)对应于最大倾斜度。
  • 每列对应一个方位角。列0(图像的左侧)对应于-x轴(即,正向的相反方向)。图像的中心对应于+ x轴(即正向)。请注意,需要进行方位角校正以确保图像的中心与+ x轴相对应。
范围图像示例

相机数据包含5个不同方位(前方、左前方、右前方、左边和右边)但是相互关联的相机的图像数据。

  • 每个摄像机提供一个摄像机图像以JPEG格式配对。除了图像字节,Waymo还提供了车辆姿态,与图像中心的曝光时间相对应的速度以及卷帘快门定时信息。如果需要,此信息可用于自定义激光雷达到摄像机的投影。

同时,相机数据和激光雷达数据已经由其内部的3D感知模型进行了同步,该模型融合了来自多个来源的数据,无需手动对齐。Waymo设计了整个自动驾驶系统——包括硬件和软件——可以无缝协同工作,包括传感器位置的选择和高质量的时间同步,这些数据可以帮助研究人员在2D和3D感知方面取得进展,并在域适配、场景理解和行为预测等方面取得进展。

4.密集的标注数据

数据集包含独立生成的激光雷达和相机数据标注,而不仅仅是投影。其中1200多段的激光雷达数据中做了高质量的3D标注,共标记了1260万个3D边界框标注,标注了车辆、行人、骑自行车的人和标识。其中1000多段的图像数据中做了2D标注,共标记了1180万个2D边界框。

三、waymo数据集下载

针对海外数据集获取难、下载慢的问题,Griviti给出了一站式解决方案——将全球资源Host至国内镜像,无需VPN访问即可享受高速下载。

1.点击进入Graviti公开数据集-Waymo页面,点击「获取数据集」

2.点击「确认」,将Waymo数据集添加到我的公开数据集中

3.添加到您的公开数据集后,系统将自动跳转到GAS控制台,点击进入「Waymo」数据集

4.选择「下载」,可以直接点击需要的文件进行下载

分享到:
Start building your AI now