1、首先,判断当前训练集上的性能是否可以接受。若模型在当前训练集上的性能表现很差,采用的算法无法在训练集上学习出良好的模型,那么暂且没有必要收集更多的数据。通过尝试增加网络层数或者每层更多的隐藏单元,以增加模型的拟合能力。此外,也可以尝试调整学习率等超参数的措施来改进学习算法。
2、如果复杂度高的模型和仔细调试的优化算法效果不佳,问题可能源自训练数据集的质量。训练数据中可能存在太多噪声,或者可能不包含预测输出所需的正确输入。此时要重新收集更干净的数据或者收集特征更加丰富的数据集。
1、首先,判断当前训练集上的性能是否可以接受。若模型在当前训练集上的性能表现很差,采用的算法无法在训练集上学习出良好的模型,那么暂且没有必要收集更多的数据。通过尝试增加网络层数或者每层更多的隐藏单元,以增加模型的拟合能力。此外,也可以尝试调整学习率等超参数的措施来改进学习算法。
2、如果复杂度高的模型和仔细调试的优化算法效果不佳,问题可能源自训练数据集的质量。训练数据中可能存在太多噪声,或者可能不包含预测输出所需的正确输入。此时要重新收集更干净的数据或者收集特征更加丰富的数据集。