Python 2.7 中的 Pandas 第 9 部分 - 统计信息

这段文字主要介绍了如何使用Python中的pandas库来获取数据统计信息。

首先,通过 df.describe() 方法可以获得一些基本的数据统计信息,包括行数、平均值、最小值、最大值、标准差、25%、50%、75% 分位数。

然后,通过 df.corr() 方法可以获得数据之间的相关性。相关性是指两个变量之间线性关系的程度,取值范围为 -1 到 1。相关性为 1 表示完全正相关,相关性为 -1 表示完全负相关,相关性为 0 表示不相关。

例如,这段文字中提到了 highopen 之间的相关性很高,因为当 open 发生明显变化时,high 也通常会发生变化。而 volumehigh minus low 之间的相关性较低,说明它们之间没有很强的线性关系。

总而言之,这段文字介绍了如何使用 df.describe()df.corr() 这两个方法来获取数据统计信息,并解释了相关性的概念以及如何通过相关性来分析数据。

在本教程中,我们将介绍 Pandas 可以快速对您的数据集执行的各种统计运算。 这包括方差和相关性等。 这实际上非常令人印象深刻,因为一种流行的投资方法是寻找相关资产并投资于落后变化的资产。 许多人付费使用服务来完成这项工作,但实际上我们用 Pandas 编程相对简单。 该系列的示例代码:http://pythonprogramming.net/python-2-7-pandas-data-analysis/Pandas 教程系列:https://www.youtube.com/playlist?list=PLQVvvaa0QuDfHt4XU7vTm22xDegR0v0fQhttp://seaofbtc.comhttp://sentdex.comhttp://hkinsley.com

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sentdex

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值