python labelencoder_python-在'float'和'str'的实例之间不支持LabelEncoder：'>'

weixin_39695374

于 2020-12-08 13:28:50 发布

阅读量323

点赞数

文章标签： python labelencoder

在进行数据预处理时，遇到一个错误，尝试用LabelEncoder处理包含对象类型的列并填充缺失值（NaN）为'UNK'。但在应用fit_transform时，出现TypeError，提示浮点型和字符串之间无法比较。问题可能源于数据集中存在混合类型的数据，导致编码过程出错。检查发现'CRMdoMédico'列没有缺失值。解决方案可能包括确保所有列的数据类型一致，或者在编码前正确处理缺失值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我面临多个变量甚至处理缺失值的错误。例如：

le = preprocessing.LabelEncoder()

categorical = list(df.select_dtypes(include=['object']).columns.values)

for cat in categorical:

print(cat)

df[cat].fillna('UNK', inplace=True)

df[cat] = le.fit_transform(df[cat])

# print(le.classes_)

# print(le.transform(le.classes_))

---------------------------------------------------------------------------

TypeError Traceback (most recent call last)

in ()

4 print(cat)

5 df[cat].fillna('UNK', inplace=True)

----> 6 df[cat] = le.fit_transform(df[cat].fillna('UNK'))

7 # print(le.classes_)

8 # print(le.transform(le.classes_))

C:\Users\paula.ceccon.ribeiro\AppData\Local\Continuum\Anaconda3\lib\site-packages\sklearn\preprocessing\label.py in fit_transform(self, y)

129 y = column_or_1d(y, warn=True)

130 _check_numpy_unicode_bug(y)

--> 131 self.classes_, y = np.unique(y, return_inverse=True)

132 return y

133

C:\Users\paula.ceccon.ribeiro\AppData\Local\Continuum\Anaconda3\lib\site-packages\numpy\lib\arraysetops.py in unique(ar, return_index, return_inverse, return_counts)

209

210 if optional_indices:

--> 211 perm = ar.argsort(kind='mergesort' if return_index else 'quicksort')

212 aux = ar[perm]

213 else:

TypeError: '>' not supported between instances of 'float' and 'str'

检查导致错误的变量导致ins：

df['CRM do Médico'].isnull().sum()

0

除了nan值，什么可能导致此错误？

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。