第二周 机器学习策略(2) 2.6 定位数据不匹配 处理训练集与开发集分布不同(数据不匹配)问题可以尝试的方法: 亲自做误差分析 尝试了解训练集和开发测试集的具体差异 将训练集变得更像开发集 收获更多类似开发集的数据 方法:可以人工合成数据 人工合成数据存在的问题:可能会对合成部分中的小部分数据过拟合