送书|推荐几个免费数据源的网站

部署运行你感兴趣的模型镜像

点击上方“极客猴”,选择“置顶公众号”

第一时间获取Python技术干货!


640

题图:by jinovich from Instagram.jpg


说到数据分析,我们会很容易联想到 Python。因为我们可以拿 Python 对已有的数据做数据分析。那什么是数据分析?数据分析指用适当的统计分析方法对收集来的大量数据进行分析,提取有价值的信息。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

“啤酒与尿布”的故事就是最典型的数据分析案例。“啤酒”和“尿布”这两个商品看上去没有关联性。而沃尔玛将其摆放在一起进行销售、并获得了很好的销售收益。原因在于沃尔玛对购物篮分析,研究出“啤酒与尿布”之间存在一定关联性。这就是数据分析的意义。

再例如通过数据分析出北京的空气质量的走势;分析近 10 年来 NBA 球队战绩和夺冠率之间的关系等等。

说到这里,你也许有疑问。我没有数据,怎么做数据分析?别急,我推荐几个免费的数据源网站。

1

awesome-public-datasets

这是一个 GitHub 仓库,其收集的数据所在领域比较广泛,收录政府、金融、计算机网络、软件、体育、气候天气等30个领域的数据。

640


这些数据集的质量都是比较高,大部分都是免费且能直接下载到的数据。

GItHub 地址:

https://github.com/awesomedata/awesome-public-datasets


2

FiveThirtyEight

FiveThirtyEight,亦称作 538,是一个专注与民意调查分析,政治,经济与体育的博客。FiveThirtyEight 维护一个名为 data 的 GitHub 仓库,专门存储数据。这些数据都来源于 FiveThirtyEight 的官网 。另外,FiveThirtyEight 被ESPN收购后 扩展了其覆盖的内容,增加了更多诸如政治,体育,科学,经济与流行文化的栏目。所以我们看到的内容如下:

640

640

这些数据都保存在 CSV 文件,我们下载之后就能用来做数据分析。

GItHub 地址:https://github.com/fivethirtyeight/data

640

另外,我自费送出两本数据分析入门书籍。美国 Facebook 数据科学家 Clinton W. Brownley 博士出品的《Python数据分析基础》。

640

这本书可以说是适合领编程经验的同学。因为这本书的学习路线是层层递减,从浅到深。学习路线是学习基础语法,创建并运行自己的Python脚本 - 读取和解析CSV文件 - 读取多个Excel工作表和工作簿 - 执行数据库操作 - 搜索特定记录、分组数据和解析文本文件 - 建立统计图并绘图 - 生成描述性统计量并估计回归模型和分类模型 。

参与方式:关注『极客猴』公众号,公众号后台回复【抽奖】。即可参与抽奖。抽奖将于周四晚上 10 点准时开奖。

推荐阅读:

100行代码爬取全国所有必胜客餐厅信息

Python 居然有这么奇葩的库--The Fuck

Python 三种遍历目录的方法,轻松帮你找出隐藏文件

10张图带你了解后台服务架构演变

不积跬步,无以至千里


640

您可能感兴趣的与本文相关的镜像

Python3.9

Python3.9

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值