提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
使用pandas对表格行列进行操作
一、删除全为0的行或者列?
import pandas as pd
path = "file_path"
df = pd.read_csv(path, encoding="utf-8")
"""方法一:"""
df1 = df.loc[:, ~(df == 0).all(axis=0)]
"""方法二:"""
cols = [x for i, x in enumerate(df.columns[1:]) if df[x].sum() == 0]
df2 = df.drop(cols, axis=1) # 利用drop方法将含有特定数值的列删除
print(df2==df1) # 可以验证一下,这两个的结果是一样的
二、删除表格中某列求和的值小于某个阈值
代码如下(示例):方法和一中的方法二的思想是一样的,参考。
import pandas as pd
path = "file_path"
df = pd.read_csv(path, encoding="utf-8")
cols = [x for i, x in enumerate(df.columns[1:]) if df[x].sum() <= 1000]
df2 = df.drop(cols, axis=1) # 利用drop方法将含有特定数值的列删除
总结
虽然方法很简单,在处理的时候记录一下,给初学者一个参考。