检查重复元素
DataFrame.
duplicated
(subset=None, keep='first') 判断DataFrame中的数据是否有重复(必须一行中所有数据都重复才算重复,只能判断行,不能判断列)返回Series
http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.duplicated.html#pandas.DataFrame.duplicated
删除重复元素
DataFrame.
drop_duplicates
(subset=None, keep='first', inplace=False)删除重复一行的所有数据。
映射
字典属于映射,键和值对应。
DataFrame.
replace
(to_replace=None, value=None, inplace=False, limit=None, regex=False, method='pad')传一个字典做为查找替换的依据(不能传函数)
map()可以传函数做为映射依据,可以对数据进行判断