在pandas中经常会对DataFrame数据类型中的数据进行一些替代或者查找等操作,之前笔者要查找一个具体数据的对应的行和列的时候,是将其先转为列表,再利用列表的index()方法找到对应的索引,但是当笔者发现了DataFrame的一种过滤操作后,觉得自己之前的方法简直弱爆了。如图一,如果要找到c列下one这个元素对应的行时,直接用df[df['c']=='one']即可,这个过滤操作简直太简单粗暴了,但是很好用。
(图一)
然后,如果相应替换df中的one,将其替换为阿拉伯数字1,那么可以通过图二的代码实现。即先对对应one的元素赋值为np.nan,即numpy中的nan常量,然后再用DataFrame的fillna()方法进行1的填充即可。这里为什么不直接用df[df=='one']=1呢?因为当df[df=='one']后的结果中不为NaN的值不都是浮点数类型的时候,就会抛出异常,比如这里的one就不是浮点数,而是字符串,具体原因笔者也不明,不知为何要这样设置。不过呢,不管什么类型,我们都可以对其赋值np.nan,这个是可以实现的,然后再用fillna()方法同样可以实现替换。
(图二)