pandas的对齐运算是数据清洗的重要过程,可以按索引对齐进行运算,如果没对齐的位置则补NaN,最后也可以填充NaN
这篇文章主要讲三个方面:
1.Series的对齐运算
2.DataFrame的对齐运算
3.填充未对齐的数据进行运算
第一部分:Series的对齐运算:
# coding:utf-8
import pandas as pd
import numpy as np
s1 = pd.Series(range(10,20),index=range(10))
s2 = pd.Series(range(20,25),index=range(5))
print('s1:')
print(s1)
print('s2:')
print(s2)
print('*'*100)
print(s2+s1)
相加不够的地方用NaN来补充:
s1:
0 10
1 11
2 12
3 13
4 14
5 15
6 16
7 17
8 18
9 19
dtype: int64
s2:
0 20
1 21
2 22
3 23
4 24
dtype: int64
****************************************************************************************************
0 30.0
1 32.0
2 34.0
3 36.0
4 38.0
5 NaN
6 NaN
7 NaN
8 NaN
9 NaN
dtype: float64