7.pandas缺失值处理（表格数据处理）

最新推荐文章于 2024-03-23 09:41:51 发布

原创最新推荐文章于 2024-03-23 09:41:51 发布 · 806 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #python #数据分析

Pandas专栏专栏收录该内容

18 篇文章

订阅专栏

在这里插入图片描述
案例：对特殊的Excel的读取，清洗，处理

1.读取excel的时候忽略前几个空行

import pandas as pd
#skiprows=2，跳过前两行
studf = pd.read_excel("../data/stu.xlsx",skiprows=2)
print(studf)

在这里插入图片描述

2.检测空值

print(studf.isnull())
# print(studf['分数'].isnull())
# print(studf['分数'].isnull())
# 筛选没有空分数的所有行
# print(studf.loc[studf['分数'].notnull(),:])

在这里插入图片描述

3.删除掉全部是空值的列

# 如果列都是空，则删除掉，how匹配所有，inplace=True代表直接修改
studf.dropna(axis="columns", how='all', inplace=True)
print(studf)

## 3.删除掉全部是空值的列

4.删除掉全部是空值的行

studf.dropna(axis="index", how='all', inplace=True)
print(studf)

在这里插入图片描述

5.将分数列为空的填充为0分

studf = studf.fillna({"分数": 0})
# 等同于
# studf.loc[:, '分数'] = studf['分数'].fillna(0)
print(studf)

在这里插入图片描述

6.将姓名的缺失值填充

使用前面有效值填充，用ffill:forward fill

studf.loc[:, '姓名'] = studf['姓名'].fillna(method='ffill')
print(studf)

在这里插入图片描述

7.将清洗好的excel保存

studf.to_excel("../data/stu_clean.xlsx", index=False)

最后结果
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

优快云专家-微编程

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Pandas数据处理100例】（八十五）：Pandas将DataFrame数据转化成字典数据

优快云精品推荐

11-30

1467

该函数可以实现将Pandas中的DataFrame数据导出为Python中的字典格式数据。

Pandas系列学习教程——06 pandas处理缺失值

lzylzy66的博客

03-11

1928

随着人工智能的不断发展，数据分析这门技术也越来越重要，很多人都开启了学习数据分析，本文就介绍了pandas学习的基础内容。本章简单介绍了pandas处理缺失值的步骤，详细请看下文。

参与评论您还未登录，请先登录后发表或查看评论

Pandas模块：读入excel/csv文件，过滤重复值和缺失值处理

qq_44039983的博客

03-11

5414

Pandas模块：读入excel/csv文件，过滤重复值和缺失值处理首先导入Pandas模块 import pandas as pd

【问题解决】pandas读取excel统计空值数量错误

想当运维的程序猿

04-05

861

pd.read_excel()读取excel数据后，用pd.isnull().sum()统计空值数量不对，代码如下。值values的变化：一个空格变成了’’，之前的nan变成了’nan’（这里是字符串nan，当然不为空）将’'和’nan’全部替换为np.nan，isnull就可以统计到。excel数据长这样，B2是一个空格，希望得到空值为2的结果。，一个是字符串’‘，一个是字符串’nan’，因此都统计不到。pd.isnull()只会统计NaN的数量。可以看到，在applymap方法处理后。

pandas读取Excel文件，以0开头的数据，出现数据缺失

Yonghang Zhang的博客

10-13

7665

这里以从深交所现在的日行情数据文件为例，格式为xlsx 直接使用df = pd.read_excel(os.getcwd() + os.sep + 'stock.xlsx')读取文件时，证券代码被转换为数字（000001 =>1），0被舍去，导致不正确。这里为了省去读入后在对代码进行补全的麻烦，再读取Excel文件时: df = pd.read_excel(os.getcw...

使用pandas将表格中的数据进行处理

IT之一小佬的博客

08-27

800

使用pandas将表格中的数据进行处理

Pandas对缺失值的处理-pandas处理excel表格缺失值

01-07

5、将姓名的缺失值进行填充 6、将清洗好的数据保存到指定excel中原始数据：最后输出数据：处理步骤： 1、读取数据： 2、删除全是空值的列 3、删除全是空值的行 4、将分数列值为NAN（空值）的填充为0分 5、...

【Pandas总结】第四节 Pandas 缺失值处理（通过实例进行演示）

weixin_47139649的博客

09-14

4879

现实中，经常有一些非常漂亮的Excel, 例如下面的例子中的Excel。这种Excel虽然好看，但是却不满足数据处理的要求，数据处理时，需要的是一个标准的表格，不包含合并单元格等这些格式；可以看到，读出的数据并非是我们想要的，我们需要的数据只有蓝色区域内，这时我们需要对读入的数据进行处理；首先我们需要把无用的行去掉，这里可以使用。:用于检测dataframe 或者 series。可以看到，全部为空值的列没有了；与去除列的方式一样，只要将。处理后：不好看，但好用！来处理全部为空值的列；来处理全部为空值的列；

数据处理Pandas-空值，0值等缺失值检测-Python实例源码.zip

12-13

本资料包“数据处理Pandas-空值，0值等缺失值检测-Python实例源码.zip”聚焦于如何利用Pandas进行空值（NaN）和0值的检测与处理。以下是关于这一主题的详细知识： 1. **Pandas库介绍**：Pandas是一个高效的数据结构...

Pandas缺失值处理

最新发布

qq_41715032的博客

03-23

746

我们导入的数据是一个不规则的学生分数数据，左边有一列空行，上面有两行空行，小王数学成绩成绩为空。

pandas 读取excel_pandas读取excel遇见空值的处理

weixin_39833290的博客

12-22

2645

使用pandas读取excel时，经常会遇到空值，这时如果读取的是整数列，便会出现如下情况：import pandas as pd>>> df = pd.read_excel(r'D:/myExcel/1.xlsx')>>> df name score0 lc 78.01 la 31.02 lb 79.03 ld 7...

千万别让缺失值影响你的数据分析结果！一文告诉你如何用 Pandas 库快速处理数据中的缺失值

热心的布丁-有计划的自学编程才会成功

06-20

1205

嗨，各位小伙伴们！马上就是一年一度的端午节了，布丁_码上成功在这里祝愿大家端午安康呀！你们有没有吃粽子呢？在享受美食的同时，我们也不能忘记实际工作中可能遇到的问题——缺失值。因为一个小小的漏写，很可能影响整个数据分析的准确性，甚至导致公司财务出现问题。所以，今天小编来给大家介绍几个Python库Pandas中处理缺失值的方法。

丢弃Excel，Pandas一行搞定

weixin_56659172的博客

09-06

696

这次咱们说说pandas的两个表的连接技能merge，也就是根据一个表的条件去匹配另一个表的内容。

Pandas 删除数据

不忘初欣丶的博客

04-16

1万+

pandas中删除数据，删除重复值、删除缺失值等

0907---Pandas 数据清洗过程中空值的删除处理

gmriwyf的博客

09-07

1211

应用 Pandas DataFrame 类方法 dropna ，对数据集中的空值按照给定的参数进行不同清洗处理，运行环境为 Jupyter notebook。

pandas清洗数据

qiming666的博客

06-05

2798

1、删除空值方法dropna（）举例1：删除包含空数据的行默认情况下，dropna() 方法返回一个新的 DataFrame，不会修改源数据。如果你要修改源数据 DataFrame, 可以使用参数:举例2：移除指定列有空值的行2、判断各个单元格是否为空isnull（）3、如何指定空数据类型在读取时，read_csv()加一个na_values参数字段。4、替换空字段方法fillna()5、使用平均数，中位数，众数来代替列中的空值。

pandas---数据处理（excel文件）

d_eng_的博客

05-20

7286

说明：防止分组后同样的数据顺序不一致，导致数据误差。

pandas读取Excel判断指定列是否有空值