LabelBinarizer进行单分类和多分类one-hot编码
此种场景适用的字符串, 之间没有天然内在顺序
5.1 Encoding Nominal Categorical Feature¶
feature
# 加载库 使用LabelBinarizer 进行one-hot编码
import numpy as np
from sklearn.preprocessing import LabelBinarizer, MultiLabelBinarizer
feature = np.array([
["Texas"],
["California"],
["Texas"],
["Delaware"],
["Texas"]
])
array([[0, 0, 1],
[1, 0, 0],
[0, 0, 1],
[0, 1, 0