1 . 获取训练样本
训练样本就是一些固定大小的图片。样本分为正样本和负样本,样本的选取是一个技术活,需要相关的知识。这里不做详述。忽略样本选取的合理性对最终神经网络性能造成的影响的前提下,样本选取主要有以下两种方式:
一 、自己动手,丰衣足食
自己在一张张大图像上使用相关的抠图软件,如ps等,扣取固定大小的小图像。也可以自己写一些小程序,自动抠图。
二、 使用一些存在的样本集
这里有一些常用人脸数据集的连接 http://blog.sina.com.cn/s/blog_6354bd9f0100hmav.html
我使用的数据集 http://cbcl.mit.edu/software-datasets/FaceData2.html