学习Pandas.DataFrame(3)
dropping and splitting dataframe
handing missing and duplicated rows
dropping column and splitting dataframe
# 从dataframe中删除列,并返回一个新dataframe
dataframe.drop(columns=['col1','col2'...])
# 从dataframe中删除列,加inplace参数直接修改源dataframe
dataframe.drop(columns=['col1','col2'...], inplace=True)
# 从dataframe中抽取几列作为一个新的dataframe
new_df = dataframe.loc[:,['col1', 'col2'...]]
handing missing value in columns and duplicated rows
# 删除dataframe中含有NaN的行,返回一个新的dataframe,info()可以列出哪些列少值
new_df = dataframe.dropna()
# 删除dataframe中含有NaN的行,加inplace参数直接修改源dataframe
dataframe.dropna(inplace=True)
# 列出duplicated的行
dataframe.duplicated()
# 删除duplicated的行并直接修改源dataframe
dataframe.drop_duplicates(inplace=True)



TO BE CONTINUED…
本文介绍了如何使用Pandas库中的DataFrame方法进行数据处理,包括删除指定列,将DataFrame拆分,以及处理缺失值(NaN)和重复行。drop函数可用于删除列,同时可选参数inplace可以决定是否直接修改原DataFrame。利用dropna和drop_duplicates可以处理缺失值和重复行,同样支持是否就地修改的选项。
31万+

被折叠的 条评论
为什么被折叠?



