名词清单
目标检测学习
上采样、下采样
图像处理中的上、下采样
缩小图像(或称为下采样(subsampled)或降采样(downsampled))的主要目的有两个:
- 使得图像符合显示区域的大小
- 生成对应图像的缩略图
放大图像(或称为上采样(upsampling)或图像插值(interpolating))的主要目的是放大原图像,从而可以显示在更高分辨率的显示设备上。
机器学习中的上、下采样
上采样,对于一个不均衡的数据,让目标值(如0和1分类)中的样本数据量相同,以数据量多的一方的样本数量为标准,把样本数量较少的类的样本数量生成和样本数量多的一方相同,称为上采样
下采样,就是以数据量少的一方的样本数量为准。 CNN中,下采样就是池化的过程
下采样原理
对于一幅图像I尺寸为M*N,对其进行s倍下采样,即得到(M/s)*(N/s)尺寸的得分辨率图像,当然s应该是M和N的公约数才行,如果考虑的是矩阵形式的图像,就是把原始图像s*s窗口内的图像变成一个像素,这个像素点的值就是窗口内所有像素的均值
上采样原理
图像放大几乎都是采用内插值方法,即在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素
训练误差
机器学习模型在训练数据集上表现的误差叫训练误差
泛化误差
机器学习模型在任意一个测试数据样本上表现出的误差的期望值,叫做泛化误差
过拟合/欠拟合
欠拟合(under-fitting): 机器学习模型无法得到较低的训练误差
过拟合(over-fitting): 机器学习模型的训练误差远远小于其在测试数据集上的误差
过拟合的解决方法
1.数据清洗,得到较纯的数据。
2.增加训练的数据量。
3.采用正则化方法。
感受野
在卷积神经网络中,感受野(Receptive Field)的定义是卷积神经网络每一层输出的特征图(feature map)上的像素点在输入图片上映射的区域大小。再通俗点的解释是,特征图上的一个点对应输入图上的区域。