pandas使用drop_duplicates去除DataFrame重复项参数
DataFrame中存在重复的行或者几行中某几列的值重复,这时候需要去掉重复行,示例如下:
data.drop_duplicates(subset=[‘A’,‘B’],keep=‘first’,inplace=True)
实例:
#保存至csv中
s=({"YYYY":Year,"State":data["State"],"TDRState":TDRState})
submit=pd.DataFrame(data=s)
submit=submit.drop_duplicates(subset=['State','TDRState','YYYY'],keep='first',inplace=False)
submit.to_csv('/Users/liyixin/Desktop/result.csv',index=False)
本文详细介绍了如何使用Pandas库中的drop_duplicates方法去除DataFrame中的重复行。通过具体实例,展示了如何指定去重的列、保留哪一行以及是否直接在原数据上操作。此方法对于数据预处理和清洗至关重要。
717

被折叠的 条评论
为什么被折叠?



