isin()函数可以直接用于选择某些特定值的数据,常用于清洗数据。
注意: 由于数据列的数据类型如果是int数据类型,isin里面用字符类型或者用int数据类型都能识别,但是如果数据列数据本身是字符类型,isin里面只能用字符类型才为true,而用int类型就会false
实例:
df=pd.DataFrame()
df['E']=['3','3','4','4']
print df.E.isin([3,4])
print "##分割###"
print df.E.isin(['3','4'])
print "##分割2###"
df['int']=[3,3,4,4]
print df.int.isin([3,4])
print df.int.isin(['3','4'])
# s=df['E'].values.tolist()
# print s
# print pd.show_versions()
pd.__version__
输出:
0 False 1 False 2 False 3 False Name: E, dtype: bool ##分割### 0 True 1 True 2 True 3 True Name: E, dtype: bool ##分割2### 0 True 1 True 2 True 3 True Name: int, dtype: bool 0 True 1 True 2 True 3 True Name: int, dtype: bool 当前用的Pandas 版本为:u'0.21.0'
本文介绍了Pandas库中isin()函数的用法,该函数用于筛选DataFrame中包含特定值的行。当数据列是整数类型时,isin()能识别整数和字符;但若数据列是字符串类型,只能接受字符类型输入。通过实例展示了isin()在数据清洗过程中的应用,并对比了不同数据类型输入的结果。适用于Python数据处理的学习者。

被折叠的 条评论
为什么被折叠?



