1.序号编码: 比如成绩的优,良,及格,不合格可以编码成4,3,2,1
2.one-hot(独热)编码:优(1,0,0,0),良(0,1,0,0),及格(0,0,1,0),不合格(0,0,0,1)
3.二进制编码:优—>100(对应于十进制的4),良—>011,及格—>010,不合格—>001
预处理时如何处理类别型特征
本文深入探讨了数据编码的三种常见方式:序号编码、one-hot编码和二进制编码,通过实例详细解释了每种编码方法的原理及其应用场景。
本文深入探讨了数据编码的三种常见方式:序号编码、one-hot编码和二进制编码,通过实例详细解释了每种编码方法的原理及其应用场景。
1.序号编码: 比如成绩的优,良,及格,不合格可以编码成4,3,2,1
2.one-hot(独热)编码:优(1,0,0,0),良(0,1,0,0),及格(0,0,1,0),不合格(0,0,0,1)
3.二进制编码:优—>100(对应于十进制的4),良—>011,及格—>010,不合格—>001

被折叠的 条评论
为什么被折叠?