MS python学习（19）

最新推荐文章于 2025-05-13 08:17:52 发布

原创最新推荐文章于 2025-05-13 08:17:52 发布 · 107 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #学习 #pandas

python 专栏收录该内容

95 篇文章

订阅专栏

本文介绍了如何使用Pandas库中的DataFrame方法进行数据处理，包括删除指定列，将DataFrame拆分，以及处理缺失值（NaN）和重复行。drop函数可用于删除列，同时可选参数inplace可以决定是否直接修改原DataFrame。利用dropna和drop_duplicates可以处理缺失值和重复行，同样支持是否就地修改的选项。

学习Pandas.DataFrame(3)

dropping and splitting dataframe
handing missing and duplicated rows

dropping column and splitting dataframe

# 从dataframe中删除列，并返回一个新dataframe
dataframe.drop(columns=['col1','col2'...])
# 从dataframe中删除列，加inplace参数直接修改源dataframe
dataframe.drop(columns=['col1','col2'...], inplace=True)

# 从dataframe中抽取几列作为一个新的dataframe
new_df = dataframe.loc[:,['col1', 'col2'...]]

handing missing value in columns and duplicated rows

# 删除dataframe中含有NaN的行，返回一个新的dataframe，info()可以列出哪些列少值
new_df = dataframe.dropna()
# 删除dataframe中含有NaN的行，加inplace参数直接修改源dataframe
dataframe.dropna(inplace=True)

# 列出duplicated的行
dataframe.duplicated()
# 删除duplicated的行并直接修改源dataframe
dataframe.drop_duplicates(inplace=True)