python pandas dataframe 去重函数
import pandas as pd
import numpy as np
import datetime
data= pd.read_csv('Power-Networks-LCL-June2015(withAcornGps)v2_2.csv', header = 0)
data_column=list(data.columns)
data1=data[[data_column[0],data_column[2],data_column[3]]]
data2=data1[data_column[0]].drop_duplicates()
参考的文章:
http://blog.youkuaiyun.com/xinxing__8185/article/details/48022401
本文介绍Python Pandas库中DataFrame数据框的去重方法,详细讲解如何利用pandas去除重复行,以实现数据清洗和预处理。
607

被折叠的 条评论
为什么被折叠?



