接触机器学习的时间还比较短,对于训练的结果往往无法解释,不知道为什么好,也不知道为什么不好。所以罗列了一下卷积神经网络中设置的参数,希望能有所帮助。
一、训练集选择
训练集(Training Set):训练模型,简单的说就是通过训练集的数据来确定拟合曲线的参数。
测试集(Test Set): 测试已经训练好的模型的精确度。
测试集和训练集的划分方法有留出法、交叉验证法和自助法,具体可以参考如何划分训练集和测试集的介绍。留出法用得比较多,自助法一般只用于样本数特别少的情况。但是,建议样本量应该要有足够多,否则机器学习的结果不太好。简单说一下注意点:1.样本要随机化,防止大数据淹没小数据(到底是样本间差异很大的样本集训练出的结果好,还是样本间差异小的样本集训练出的结果好,比较疑惑图像的视角不同和颜色不同对结果的影响。);2.训练集数据的数量应占2/3到4/5,剩下的是测试集;3.样本要做归一化,归一化的具体作用是归纳统一样本的统计分布性,能减少训练时间,避免出现异常样本数据引起的训练结果无法收敛。
二、卷积参数设置
如网络层数、卷积核大小、滑动步长等属于超参数,大多是通过已有的架构来做一些微调。
一般的图像识别