fillna填充某一列_DataFrame基础运算以及空值填充的案例分析

最新推荐文章于 2024-10-21 15:47:34 发布

原创

最新推荐文章于 2024-10-21 15:47:34 发布 · 1.7k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#fillna填充某一列

本文介绍了如何使用Pandas DataFrame进行数据对齐和空值填充。在计算两个DataFrame的加和时，缺失值会被置为NaN。通过`fillna`方法可以指定填充空值的方式，如用特定值、计算值或前后值填充。`isna`用于检测空值，`dropna`用于删除含空值的行或列，`fillna`则用于填充空值，支持多种填充策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据对齐

我们可以计算两个DataFrame的加和，pandas会自动将这两个DataFrame进行数据对齐，如果对不上的数据会被置为Nan(not a number)。

首先我们来创建两个DataFrame：import numpy as npimport pandas as pddf1 = pd.DataFrame(np.arange(9).reshape((3, 3)), columns=list('abc'), index=['1', '2', '3'])df2 = pd.DataFrame(np.arange(12).reshape((4, 3)), columns=list('abd'), index=['2', '3', '4', '5'])复制代码

得到的结果和我们设想的一致，其实只是通过numpy数组创建DataFrame，然后指定index和columns而已，这应该算是很基础的用法了。

然后我们将两个DataFrame相加，会得到：

我们发现pandas将两个DataFrame加起来合并了之后，凡是没有在两个DataFrame都出现的位置就会被置为Nan。这其实是很有道理的，实际上不只是加法，我们可以计算两个DataFrame的加减乘除的四则运算都是可以的。如果是计算两个DataFrame相除的话，那么除了对应不上的数据会被置为Nan之外，除零这个行为也会导致异常值的发生(可能不一定是Nan，而是inf)。

fill_value

如果我们要对两个DataFrame进行运算，那么我们当然不会希望出现空值。这个时候就需要对空值进行填充了，我们直接使用运算符进行运算是没办法传递参数进行填充的，这个时候我们需要使用DataFrame当中为我们提供的算术方法。

DataFrame当中常用的运算符有这么几种：

add、sub、p这些我们都很好理解，那么这里的radd、rsub方法又是什么意思呢，为什么前面要加上一个r呢？

看起来费解，但是说白了一文不值，radd是用来翻转参数的。举个例子，比如说我们希望得到DataFrame当中所有