Pandas数据处理与文件读写全解析
1. Pandas数据处理基础
1.1 计算相关性
在数据处理中,计算相关性是一项常见的任务。通过传递一个DataFrame,可以计算匹配列名的相关性。例如,计算百分比变化与交易量的相关性:
In [289]: returns.corrwith(volume)
Out[289]:
AAPL -0.075565
GOOG -0.007067
IBM -0.204849
MSFT -0.092950
dtype: float64
若传递 axis="columns" ,则会逐行进行计算。在所有情况下,计算相关性之前,数据点会按标签对齐。
1.2 唯一值、值计数和成员资格
对于一维Series,有一类相关方法可提取其值的信息。
1.2.1 unique方法
unique 方法用于获取Series中的唯一值数组。示例如下:
In [290]: obj = pd.Series(["c", "a", "d", "a", "a", "b", "b", "c", "c"])
In [291]: uniques = obj.unique()
In [292]: uniques
Out[292]: array(['c', 'a', 'd', 'b'], dtype=object)
Pandas数据处理与文件读写详解
超级会员免费看
订阅专栏 解锁全文
640

被折叠的 条评论
为什么被折叠?



