pandas 库:数据处理与读写全解析
1. pandas 库基础操作
在数据处理中,pandas 库是一个强大的工具。下面将介绍它的一些基础操作,包括排名、相关性和协方差计算,以及处理缺失值等。
1.1 排名操作
排名可以按照数据在数据结构中的原有顺序进行分配,而无需进行排序操作。只需在方法选项中指定 'first'
值即可。
import pandas as pd
ser = pd.Series([0, 1, 2, 3, 9], index=['red', 'blue', 'yellow', 'white', 'green'])
print(ser.rank(method='first'))
默认情况下,排名是升序排列的。若要反转排序标准,可将 ascending
选项设置为 False
。
print(ser.rank(ascending=False))
1.2 相关性和协方差计算
相关性和协方差是两个重要的统计计算,在 pandas 中可以使用 corr()
和 cov()
函数来实现。这些计算通常涉及两个 Series
。
seq2 = pd.Se