参考博文:https://blog.youkuaiyun.com/gdh756462786/article/details/79161525
数据中有分类属性,往往是非数值类型,需要转化为数值属性。
1.头文件
from sklearn.preprocessing import LabelEncoder #用于Label编码
from sklearn.preprocessing import OneHotEncoder #用于one-hot编码
2.Label编码
①数据
data = ['cold', 'cold', 'warm', 'cold', 'hot', 'hot', 'warm', 'cold', 'warm', 'hot']
values = np.array(data)
②编码
lf=LabelEncoder().fit(values)
data_label=lf.transform(values)
print(data_label)
out: array([0, 0, 2, 0, 1, 1, 2, 0, 2, 1], dtype=int64)
②等价于
data_label =