pandas的广播机制和运算

最新推荐文章于 2025-08-05 09:27:14 发布

原创最新推荐文章于 2025-08-05 09:27:14 发布 · 1.7k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#数据分析 #python

数据科学计算库专栏收录该内容

5 篇文章

订阅专栏

本文探讨了pandas中的广播机制，解释了如何使用该机制进行数据操作，如减去某一行或某一列。虽然基于numpy，但pandas的广播机制在处理数据时提供了便利。举例说明了当尝试减去一行时，所有行都会减去对应的第一行数据；而在减去一列时，由于索引不匹配，结果将返回NaN，除非有重复索引的列才会进行广播计算。

pandas的广播机制

pandas是基于numpy的，所以numpy的数据索引方法和运算函数在pandas中同样适用。pandas在计算时也具有广播机制，这使得计算很便捷。

pandas减去某一行

# 导包
import numpy as np
import pandas as pd 
# 随机数种子
rng=np.random.RandomState(256)
data=rng.randint(10,size=(5,5))

# 生成DataFrame
data1=pd.DataFrame(data=data,columns=list('ABCDE'))
data1

	A	B	C	D	E
0	0	7	1	0	9
1	5	6	7	3	2
2	8	7	4	6	4
3	2	0	9	7	9
4	0	2	0	9	8

# pandas所有行都减去某一行
data1-data1.iloc[0] # 中括号中只有一个维度时表示行

	A	B	C	D	E
0	0	0	0	0	0
1	5	-1	6	3	-7
2	8	0	3	6	-5
3	2	-7	8	7	0
4	0	-5	-1	9	-1

所有行的数据都减去了第一行的对应数据。

pandas减去某一列

data1

	A	B	C	D	E
0	0	7	1	0	9
1	5	6	7	3	2
2	8	7	4	6	4
3	2	0	9	7	9
4	0	2	0	9	8

data1.iloc[:,0]

0    0
1    5
2    8
3    2
4    0
Name: A, dtype: int32

# 错误的做法
data1-data1.iloc[:,0]

	A	B	C	D	E	0	1	2	3	4
0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
4	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN

这样的结果都是NaN，在下面的案例中会看到原因

# 正确的做法
data1.subtract(data1.iloc[:,0],axis=0)

	B	C	D	E
0	7	1	0	9
1	1	2	-2	-3
2	-1	-4	-2	-4
3	-2	7	5	7
4	2	0	9	8

# 错误的做法，同上
data1.subtract(data1.iloc[:,0])

	A	B	C	D	E	0	1	2	3	4
0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
4	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN

看完这个就明白为啥上面的做法是错误的了

# 取出某些值
data1.iloc[0,[1,3]]

B    7
D    0
Name: 0, dtype: int32

data1-data1.iloc[0,[1,3]]

	A	B	C	D	E
0	NaN	0.0	NaN	0.0	NaN
1	NaN	-1.0	NaN	3.0	NaN
2	NaN	0.0	NaN	6.0	NaN
3	NaN	-7.0	NaN	7.0	NaN
4	NaN	-5.0	NaN	9.0	NaN

B和D是两者有重复索引的列，所以元素少的会被广播。DataFrame中B和D列会相应减去B,D广播后的值。而没有重复索引的列将会是NaN。

	A	B	C	D	E	0	1	2	3	4
0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
4	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN

	A	B	C	D	E	0	1	2	3	4
0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
4	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN

	A	B	C	D	E	0	1	2	3	4
0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
4	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN

	A	B	C	D	E	0	1	2	3	4
0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
4	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN

	A	B	C	D	E	0	1	2	3	4
0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
4	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN

	A	B	C	D	E	0	1	2	3	4
0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
4	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN