通过分析这几个集的误差大小可以大致判断误差来源,其中针对偏差和方差的处理方法已经在我之前的博客里面有说明了。所以主要讲解数据不匹配问题。
总而言之,遇到数据不匹配问题,做误差分析,对比训练集和开发集,试图找出这两个数据分布到底有什么不同,然后考虑是否有办法收集更多与开发集相似的数据做训练。


通过分析这几个集的误差大小可以大致判断误差来源,其中针对偏差和方差的处理方法已经在我之前的博客里面有说明了。所以主要讲解数据不匹配问题。
总而言之,遇到数据不匹配问题,做误差分析,对比训练集和开发集,试图找出这两个数据分布到底有什么不同,然后考虑是否有办法收集更多与开发集相似的数据做训练。