猫的分类举例:
假设我们可以从网上获取大量的高清晰的猫的图片去做分类,如20W张,但是只能获取少量利用手机拍摄的不清晰的图片,如1W张。但是我们系统的目的是应用到手机上做分类。 也就是说,我们的训练集和开发集、测试集来自于不同的分布。
那么我们如何去确定是由于分布不匹配的问题导致开发集的误差,还是由于算法中存在的方差问题所致?

探讨了在不同图片质量下,如何区分由算法方差或数据分布差异引起的分类误差,特别是在高清晰与低清晰图片间的训练与测试场景。
猫的分类举例:
假设我们可以从网上获取大量的高清晰的猫的图片去做分类,如20W张,但是只能获取少量利用手机拍摄的不清晰的图片,如1W张。但是我们系统的目的是应用到手机上做分类。 也就是说,我们的训练集和开发集、测试集来自于不同的分布。
那么我们如何去确定是由于分布不匹配的问题导致开发集的误差,还是由于算法中存在的方差问题所致?


被折叠的 条评论
为什么被折叠?