去除空标签
unknownEntities字段为空的行去除
data.drop(data[pd.isna(data[‘unknownEntities’])].index, inplace=True)
如果是多个条件的话,在里面的[]的各个条件加括号,用& 或 | 组合条件
iloc
dataframe用iloc取每行的数据,但是只能有下标,两个维度都是
dict 转 dataframe
s = pd.Series(new_dict)
df = pd.DataFrame(s)
df.reset_index()
df.columns=['key','value']
复制行数据
dataframe.append(Serics)
data = data.append([{col:d,col2:d2}])
取单元格数据
dataframe.iloc[index][‘cloumnName’]或者dataframe.loc[index,‘columnName’]
赋值
dataframe.loc[index,‘columnName’]
按列筛选
data[(data[‘col1’]==a) | (data[‘col2’]>b)]
groupby order head
先排序再group
df.sort_values(‘column’, ascending=False).groupby(‘column’).head(TOPK)

本文介绍如何使用pandas处理数据,包括去除含有空unknownEntities的行,通过条件筛选和iloc操作,以及DataFrame的基本操作如dict转dataframe、复制行和单元格数据获取。重点讲解了groupby和排序的高级应用,适合数据分析师和开发者阅读。
3349

被折叠的 条评论
为什么被折叠?



