数据来源
主要收集一些常用的数据来源方法,主要参考《鲜活的数据数据可视化指南》一书
- 搜索引擎
- 大学数据库
- 综合数据类应用
- 专题类数据
- Python爬取网页数据
搜索引擎
- 谷歌的镜像网站:谷歌363
- 可以有基础统计结果的搜索引擎:WolframAlpha
大学数据库
- 加州大学欧文分校机器学习:UCI Machine Learning Repository
- 加州大学伯克利分校:UCB Data Lab
个人认为Awesome Public Datasets的内容就已经很全很好用了
综合数据类应用
主要是通过应用API获得数据,不过像wikidata等的都不是很好用,这里不作过多的记录
专题性数据
- 地理