对于离散特征,如类别特征,除了常用的one-hot encoding(dummy encoding)方法,还有一种方法-特征交叉。前者可以学习到每个特征的main effects,但是不能学习到特征之间的interaction effects。
可以通过特征交叉,也叫特征组合,比如两个特征:经度和纬度,可以组合成经度✖️纬度。
推荐参考《Probabilistic machine learning》书中1.5.3部分进行学习:
对于离散特征,如类别特征,除了常用的one-hot encoding(dummy encoding)方法,还有一种方法-特征交叉。前者可以学习到每个特征的main effects,但是不能学习到特征之间的interaction effects。
可以通过特征交叉,也叫特征组合,比如两个特征:经度和纬度,可以组合成经度✖️纬度。
推荐参考《Probabilistic machine learning》书中1.5.3部分进行学习: