
深度学习
luoying_1993
fighting
展开
-
2. 离散特征处理方法--特征交叉 feature crosses
对于离散特征,如类别特征,除了常用的one-hot encoding(dummy encoding)方法,还有一种方法-特征交叉。前者可以学习到每个特征的main effects,但是不能学习到特征之间的interaction effects。可以通过特征交叉,也叫特征组合,比如两个特征:经度和纬度,可以组合成经度✖️纬度。推荐参考《Probabilistic machine learning》书中1.5.3部分进行学习:...原创 2021-12-24 23:16:36 · 1011 阅读 · 0 评论 -
1. 训练集、开发集、测试集(Train/Dev/Test sets)
1.在以往的机器学习中如上图所示,以往机器学习中,对训练集、开发集、测试集的划分比例为60/20/20,如此划分通常可以获得较好的效果。训练集(training set):训练算法。开发集(development set):调整参数、选择特征,以及对学习算法作出其它决定。测试集(test set):开发集中选出的最优的模型在测试集上进行评估。不会据此改变学习算法或参数。2....原创 2019-02-13 14:42:42 · 30996 阅读 · 7 评论