一、A2D2数据集:让研究人员和开发人员专注于开发新技术
发布方:奥迪公司(AUDI AG)
发布时间:2020年
为支持创业公司和从事无人驾驶的学术研究人员,奥迪公司发布了奥迪自动驾驶数据集(Audi Autonomous Driving Dataset,简称A2D2)。

众所周知,为车辆配备多模式传感器套件、记录大型数据集并对其进行标记需要大量的时间和人力,而奥迪的A2D2数据集消除了这一高门槛,让研究人员和开发人员能够专注于开发新技术。该数据集包含2D语义分割、3D点云、3D标注数据以及车辆行驶数据。
数据集大小:2.26TB
获取地址:https://www.graviti.cn/dataset-detail/A2D2
二、CURE-TSD数据集:挑战非真实&真实环境下交通标志识别
发布方:乔治亚理工学院(The Georgia Institute of Technology)
发布时间:2017年
乔治亚理工学院研究了交通标志识别算法在挑战性条件下的鲁棒性。
为解决现有数据集在规模和场景覆盖上的不足,乔治亚理工学院发布了CURE-TSD数据集(Challenging Unreal and Real Environments for Traffic Sign Recognition)。CURE-TSD数据集是用来挑战非真实&真实环境下交通标志识别的数据集,该数据集包含200多万张基于真实世界和模拟器数据的交通标志图像。

乔治亚理工学院认为:通过在现实场景中对现有解决方案性能进行基准测试,并针对具有挑战性的条件分析性能变化,挑战性条件会显著降低基线方法的性能,尤其是在这些挑战性条件导致空间信息的丢失或错位的情况下。
乔治亚理工学院还研究了数据增强的效果,并表示模拟器数据和真实世界数据的使用提高了真实世界场景的平均识别性能。
数据集大小:233.61GB
获取地址:https://www.graviti.cn/dataset-detail/CURE_TSD
三、The Boxy Vehicles数据集:大型车辆检测数据集
发布方:博世公司(Bosch)
发布日期:2019年

The Boxy Vehicles 数据集包含近200万辆带标注的车辆图像,用于训练和评估高速公路上自动驾驶汽车的目标检测方法。
数据集详情:
- 20万张图像
- 199万辆带标注的车辆
- 500万像素分辨率
- 阳光、雨水、黄昏、夜晚
- 畅通的高速公路、交通拥挤、交通堵塞
数据集大小:851.62GB
获取地址:https://www.graviti.cn/dataset-detail/BoxyVehicles
四、NightOwls数据集:夜间行人检测数据集
发布方:视觉几何组(Oxford Visual Geometry Group,该小组隶属于1985年成立的Robotics Research Group,研究范围:机器学习~移动机器人)
发布时间:2018年

NightOwls数据集主要用来检测夜间的行人,该数据集包含由摄像机拍摄、40个视频序列组成的279,000张完整标注的图像。
与白昼相比,夜间照明度差,反射、模糊和对比度变化多,因此夜间行人检测更具挑战性。
数据集特征:
1) 复杂性(4个分类)
- 行人
- 骑自行车的人
- 骑摩托车的人
- 忽略区域
2) 多样性
- 3个国家和多个欧洲城市
- 一年四季
- 白天和夜晚
- 所有的天气条件
- 大量的动态
- 不同的场景布局
- 不同的背景
- 图像有模糊、也有清晰的,质量好坏实际取决于场景的照明程度和车辆速度
数据集大小:293.72GB
获取地址:https://www.graviti.cn/open-datasets/dataset-detail/NightOwls
五、comma.ai driving数据集:高速公路驾驶视频数据集
发布方:Comma. ai
发布时间:2016年
comma.ai driving数据集记录了7.5个小时的高速公路驾驶。该数据集由10个可变大小的视频片段组成,这些视频片段是用安装在挡风玻璃上的Acura ILX 2016摄像机以20赫兹的频率所录制。
录制视频的同时,我们还记录了一些测量值,如车速、加速度、转向角、GPS坐标、陀螺仪角度。这些测量值被转换成统一的100Hz时基。
数据集大小:44.96GB
获取地址:https://www.graviti.cn/open-datasets/dataset-detail/comma.ai_driving
六、HD1K数据集:无人驾驶数据集和光流基准
发布方:海德堡图像处理合作实验室(The Heidelberg Collaboratory for Image Processing, HCI)

HD1K基准套件是一个自动驾驶数据集和光流基准。该数据集是由海德堡大学与罗伯特·博世公司紧密合作的图像处理研究所创建的。这些数据是在一个受控的环境中捕获的,该环境具有交通场景、天气和照明条件的系统变化。数据以200Hz的帧率采集,分辨率为2560x1080。
- 大于1000帧,2560x1080,具有不同的照明和天气情况
- 光流中带有误差棒的参考数据
- 动态对象的评估遮罩
- 挑战性场景的特定鲁棒性评估
数据集大小:7.85GB
获取地址:https://www.graviti.cn/dataset-detail/HD1K
七、Lyft-perception数据集:可靠的原始传感器数据
发布方:来福车(Lyft)交通网络公司
发布时间:2019年

来福车的自动驾驶汽车配备了一个内部传感器套件,可以收集其他汽车、行人、交通灯等的原始传感器数据。该数据集以Lyft无人驾驶车队在有限的地理区域内收集的原始激光雷达和相机输入为特征。
数据集详情:
- 3D标注(1.3M)
- 激光雷达点云(30K)
- 60-90分钟的场景(350+)
数据集大小:117.94GB
获取地址:https://www.graviti.cn/open-dataset/dataset-detail/Lyft-perception
八、Lyft-prediction数据集:最大的交通行为主体动作数据集
发布方:来福车(Lyft)交通网络公司
发布时间:2020年

该数据集包括无人驾驶车队遇到的汽车、骑自行车者、行人等其他交通行为主体的动作日志。这些日志来自通过来福车的感知系统处理原始激光雷达、相机和雷达数据,是训练运动预测模型的理想选择。
数据集详情:
- 数小时的交通行为主体动作(1000+)
- 23辆车的数英里数据(16K)
- 语义地图标注(15K)
数据集大小: 71.81GB
获取地址:https://www.graviti.cn/open-datasets/dataset-detail/Lyft-prediction