最近在搞数据分析,遇到图中的问题,我想将没有找到该记录这些行都给删掉,但是在dataframe中查找drop方法,完全没有我想要的方法,后来想到,我删不掉,我提取出来总可以吧,记录下,供自己查看
import pandas as pd
df = pd.read_excel('11ts.xls')
df1 = df.dropna(axis=0, how='all') # 用来删除缺失数据 返回值是删除后的df
df2 = df1.drop_duplicates(subset='股票代码', keep='last')
df3 = df2[df2.iloc[:,2]!='没有找到该记录']
# df2.drop(df2['股票简称']=='没有找到该记录') # 删不掉数据 我提取
print(df3)
运行结果如下:
ID 股票代码 股票简称 … 股息率TTM PEG EV/EBITDA
2 2.0 601857-SHE 中国石油 … 0.07 0.02 7.96
4 4.0 600759-SHE 洲际油气 … NaN 0.00 79.98
6 6.0 600777-SHE 新潮能源 … NaN 0.00 149.27
8 8.0 601699-SHE 潞安环能 … NaN 0.00 20.74
10 10.0 601666-SHE 平煤股份 … NaN 0.01 19.37
12 12.0 002128-SZE 露天煤业 … NaN 0.01 12.94