这可能是国内最好的AI数据集下载网站 | 1000+优质数据集免费高速下载
作者:graviti
发布于 1/29/2021

数据、算力、算法被视为推动AI发展的三大要素,其中数据是决定模型质量的关键,更好的数据才能训练出更好的模型。因此,找到高质量数据集是炼丹的第一步。

然而,由于开源数据的质量参差不齐、预览困难,且数据量大、下载速度慢,花费九牛二虎之力还是没有遇上“对”的数据集已是家常便饭......你是否期待有一个公开数据集平台能够在线预览原始数据、标注数据、数据标签分布,并支持高速下载?

它已经来了。

Graviti Open Datasets是一个提供海量公开数据集的平台,可通过应用场景和标注类型,轻松定位到想要的数据集;支持在线预览原始数据、标注数据、数据标签及属性分布;无需“梯子”即可免费高速下载 1000+ 高质量数据集,下载速度高达15MB/s

一、丰富多元的数据集种类

1000+ 优质数据集免费获取

  • 覆盖无人驾驶、文本检测、行为/事件检测、语义分割、姿态估计、场景识别、面部检测、目标追踪、ASR、AR/MR、深度估计等 50+ 种AI应用领域
  • 拥有2D分类、2D多边形、2D矩形等 30+ 种标注任务
  • 支持图像、视频、文本、语音、点云、IMU、3D模型等 10+ 种主流数据格式

二、多维快捷的数据集查找与定位

快速查找数据集:Open Datasets就像一把打开公开数据集的万能钥匙。用户不仅可以通过关键词精准定位心仪数据集,还可以通过数据集名称联想,数据集应用场景、标注类型的筛选进行多维度查找。

一目了然的数据集结构化描述:Open Datasets拥有明晰的信息展示方式,通过将数据的应用场景、标注类型、数据概要信息及协议信息结构化,方便您迅速定位数据关键信息,提高您的阅读体验。


三、清晰高效的数据在线可视化


非结构化数据管理的最大难点之一是“无法在线预览”。用户在下完数据集后还要写代码做数据可视化,常常发现图片格式错误、标注质量差,甚至根本不是自己想要的……而在Open Datasets,用户可以完美跳过下载步骤,无需另写代码,通过Graviti组件式数据可视化工具在线预览原数据、标注数据、数据特性(数据标签及属性分布),还可以通过COPY预览页面的URL/IFRAME将可视化组件嵌入到自己的页面


支持列表、柱状图、饼图等多种信息统计方式,提前掌握数据细节,试错成本大幅降低。

四、高速稳定的海外数据下载


针对海外数据获取难、下载慢的问题,Graviti给出了一站式解决方案——将全球资源Host至国内镜像,无需VPN访问,满带宽极速下载。和进入海外官网下载相比,Graviti至少提速100%。从此告别令人抓狂的下载报错!

普通带宽下载海外数据,实测就有15+MB/s的速度

五、在线获取并使用数据集协同TensorBay平台赋能开发效率


面对庞杂的非结构化数据信息,如何存储、查询、分析、挖掘和利用就显得尤为关键。传统管理手段已无满足身处复杂数据环境的智能系统/应用的AI开发者。为了帮助AI开发者更高效地迭代模型,而不是将精力耗费在管理数据的工作上,格物钛打造了TensorBay非结构化数据管理SaaS。

用户在Open Datasets获取数据集后,可选择Fork数据集,之后便能在TensorBay对原数据集进行修改,享受一站式数据管理服务:

  • 安全可靠的数据云端托管
  • 清晰可溯的版本管理
  • 便捷高效的数据可视化
  • 赋能开发者团队的数据协同
  • 简单易用的开发者工具

六、完善的数据集社区支持


面对多样化用户需求,Graviti提供问题与需求的反馈渠道,一对一针对性回应、跟进、解决用户对于数据集的需求,以及在数据管理过程中遇到的任何问题。


如果在Graviti官网没有找到自己想要的数据集,或者在TensorBay数据管理上有任何需求,可以去他们的官方微信群进行反馈,说不定下次就为你上线了呢 :)



七、打破数据壁垒,走向合作

人工智能领域的重大技术突破需要依靠开源的形式提升创新质量,开源本质上是一种人才、智慧的聚合,是产业升级的强大助推器。开源数据集将为开发者提供更丰富、全面、高质量的数据应用和参考,特别是对那些缺少资金和渠道来获取可靠数据集的中小开发者,帮助巨大。格物钛希望打造公开数据集平台,在贡献社区的同时,也期待携手更多开发者、商业合作伙伴共同参与社区建设,形成行业标准和最佳实践。——格物钛创始人&CEO 崔运凯

一个永不会终止的倡议

寻集令是格物钛面向全球发起的公开数据集行动倡议,我们希望打造集合无人驾驶、互联网泛娱乐、新零售、智慧城市和在线教育多个领域的AI公开数据集生态联盟,促使数据开源成为一个长期共赢的模式,助力AI行业的高效开发和创新。

加入我们:

  • 享受独家权益

超过100+各类行业媒体的宣传支持,优选合作伙伴专属的独立数据集展示页面,更多数据集伙伴的独家联合推广的市场活动支持,策划直播活动,开发者社区数据集宣传等

  • 提高行业影响力

发布的数据集将通过中国各区域人工智能行业协会联合1000+个会员单位推广使用,提升企业在行业内的影响力。Graviti作为面向所有开发者的AI数据服务平台,将触达超过60万的开发者社区,全力帮助企业提高知名度。

  • 拥抱更多合作机遇

我们的数据集将吸引中国人工智能领域的关注,成为我们的一员将助您向更多行业合作伙伴展示您的数据集实力,拥抱更多合作机遇。

寻集令现有合作伙伴一览

公开数据集合作垂询

邮箱:bd@graviti.cn

电话:021-31075066

您希望使用机器学习颠覆行业

我们帮助让机器学习变得简单

即刻体验数据集高速获取&在线管理:https://www.graviti.cn/open-datasets

分享到:
Start Building AI Now