对于离散特征,如类别特征,除了常用的one-hot encoding(dummy encoding)方法,还有一种方法-特征交叉。前者可以学习到每个特征的main effects,但是不能学习到特征之间的interaction effects。
可以通过特征交叉,也叫特征组合,比如两个特征:经度和纬度,可以组合成经度✖️纬度。
推荐参考《Probabilistic machine learning》书中1.5.3部分进行学习:

本文探讨了离散特征编码方法,如one-hot encoding之外的另一种策略——特征交叉,它能捕捉特征间的交互作用。通过实例和《Probabilistic machine learning》中的相关内容,深入解析如何通过经度×纬度等组合来揭示特征间的关系。
对于离散特征,如类别特征,除了常用的one-hot encoding(dummy encoding)方法,还有一种方法-特征交叉。前者可以学习到每个特征的main effects,但是不能学习到特征之间的interaction effects。
可以通过特征交叉,也叫特征组合,比如两个特征:经度和纬度,可以组合成经度✖️纬度。
推荐参考《Probabilistic machine learning》书中1.5.3部分进行学习:

2848
2814
815
1270

被折叠的 条评论
为什么被折叠?