场景
- 一部电影可以同时属于爱情片和科幻片
- 一篇文章可以同时包含娱乐和汽车
- 一张图片可以同时出现猫和狗。
- 参考网址:https://scikit-learn.org/stable/modules/multiclass.html
多标签二值化
from sklearn.preprocessing import MultiLabelBinarizer
Y = [[], [1], [2], [1, 2]]
print(MultiLabelBinarizer().fit_transform(Y))
打印结果
[[0 0]
[1 0]
[0 1]
[1 1]]
分类器
from sklearn.preprocessing import MultiLabelBinarizer
from sklearn.multiclass import OneVsRestClassifier
from sklearn.tree import DecisionTreeClassifier
# 样本
X = [
[1, 0, 1, 0], [0, 1, 0, 1], [0, 1, 1, 0], [1, 0, 0, 1],
[1, 1, 0, 0], [2, 0, 0, 0], [0, 2, 0, 0],
[0, 0, 1, 1], [0, 0, 2, 0], [0, 0, 0, 2],
[1, 1, 1, 1], [2, 0, 2, 0],