整理 | suiling
出品 | AI科技大本营(ID:rgznai100)
对于从事机器学习的小伙伴来说,机器学习必须以大量的数据为基础,否则构建再好的模型也不能达到你想要的效果。同时,不同质量的数据集也会影响到模型训练的效果。之前营长就为大家推荐过一款机器学习数据集集合项目,如今该项目的作者已经如他所言更新内容啦!不信你看~
该项目包含了计算机视觉、自然语言处理、医疗等数据集,此外作者还很贴心地放上了每个数据集的时间、描述以及相关的Paper。

以下是该列表中的部分数据集
-
计算机视觉数据集
-

- 自然语言处理数据集
-

- 问答数据集
-

- 医疗数据集
-

更详尽的数据集列表,请见:https://www.datasetlist.com/
下边给大家推荐两个查找数据集的网站:
-
UCI machine learning repository:https://wordnet.princeton.edu/
-
UCI数据集是一个常用的机器学习标准测试数据集,经常出现在各种机器学习论文当中。
关于如何使用该数据集,可参考优快云博客上的一篇文章:https://blog.youkuaiyun.com/qq_32892383/article/details/82225663
-
Kaggle datasets:https://www.kaggle.com/datasets
-
Kaggle,一个数据科学竞赛网站,大家都很熟悉了。
-
精彩推荐
「2019 Python开发者日」精彩日程全揭晓~这一次我们依然“只讲技术,拒绝空谈”10余位一线Python技术专家共同打造一场硬核技术大会。更有深度培训实操环节,为开发者们带来更多深度实战机会。
-

本文推荐了一个包含计算机视觉、自然语言处理及医疗等多个领域的高质量数据集项目。该项目不仅提供了丰富的数据资源,还附带了每个数据集的时间、描述及其相关研究论文。文中还介绍了两个常用的数据集查找网站:UCI机器学习资料库和Kaggle数据集。
6万+

被折叠的 条评论
为什么被折叠?



