awesome-dataset-hub

awesome-dataset-hub

说明:倾向于深度学习等数据集,希望可以从网站找到所有的数据集,而不仅仅是某个组织的数据库。最好是可以搜索,如基于数据集类型搜索(人脸检测、文本分类等),基于数据集文件名搜索,基于数据集在论文中的别名搜索。

github

竞赛类

竞赛类数据集都强烈推荐,可按论文,数据集名称进行搜索。

搜索类

  • pgram 目前似乎不用*,数据集也挺全的,支持用户添加,使用方便。
  • google dataset search 名气大,但感觉一般,目前智能搜索结果的还是不如人工收集的。
  • academictorrents 学术型数据集,可用文件名搜索,对常用的数据集进行备份,支持用户上传数据集。强烈推荐
    awesome-dataset-hub
  • datasetlist UCI机器学习数据库升级版

网页型

  • YACVID 至2020仍在维护,比cvdataset, cvonline好一些。
  • reddit r/datasets 发贴分享数据集,可搜索,但未必能搜到。