编码用途序号编码通常用于处理类别间具有大小关系的数据独热编码通常用于处理类别间不具有大小关系的特征二进制编码先用序号编码给每个类别赋予一个类别ID,然后将类别ID对应的二进制编码作为结果Helmert ContrastSum ContrastPolynomial CotrastBackward Difference Contrast栗子 性别 性别类别ID二进制表示狂热编码男10 11 0女21 00 1血型 血型类别ID二进制表示狂热编码A10 0 11 0 0 0B20 1 00 1 0 0AB30 1 10 0 1 0O41 0 00 0 0 1