数据来源
主要收集一些常用的数据来源方法,主要参考《鲜活的数据数据可视化指南》一书
- 搜索引擎
- 大学数据库
- 综合数据类应用
- 专题类数据
- Python爬取网页数据
搜索引擎
- 谷歌的镜像网站:谷歌363
- 可以有基础统计结果的搜索引擎:WolframAlpha
大学数据库
- 加州大学欧文分校机器学习:UCI Machine Learning Repository
- 加州大学伯克利分校:UCB Data Lab
个人认为Awesome Public Datasets的内容就已经很全很好用了
综合数据类应用
主要是通过应用API获得数据,不过像wikidata等的都不是很好用,这里不作过多的记录
专题性数据
- 地理

本文探讨了多种获取数据的途径,包括利用搜索引擎、大学数据库如UCI Machine Learning Repository,综合数据类应用的API,专题性数据资源如体育赛事数据,以及使用Python进行网页数据爬取。介绍了谷歌镜像、WolframAlpha、体育数据平台等实用资源。
最低0.47元/天 解锁文章
2389

被折叠的 条评论
为什么被折叠?



