Python中的方法/函数
使用pandas模块下的drop_duplicates()可以方便快速地从数据里去除掉重复的数据,且非常灵活。
参考博文:
http://blog.youkuaiyun.com/yen_csdn/article/details/53445616
备注:中午使用这一方法获得清洗后的数据以后,感觉自己从菜鸟晋级了 :)
感悟:
我们在日常工作中要解决的各种问题,相信在python中的相应模块里,都可以找到成熟的、强大的方法/函数,帮助我们快速、高效、灵活地解决各种各样的问题。
灵活熟练地使用这些前人已有的工作成果,也是一个成熟的程序员应当具备的基本素质。
顺祝大家国庆节快乐!