今天的主要任务是convnet
我们要训练4个cnn 网络,如果是四个的话 我们是需要取哪四个点那
眼角? 鼻子 ? 嘴角? 貌似五个更合适
刚跟师兄LCH 聊了一下 他的想法是 眼睛截一块 鼻子截一块 嘴一块 整个的一块
google idea 师兄说ImageNet 是输出很多个概率,比如你有多少类就输出多少概率。这是测试环节的问题
那训练环节的话 我们的目标是每一个小patch 出来一个160维的向量。
即是每个小patch 卷积 maxpooling 卷积maxpooling 四次 最后全连接成 输出160维的向量
我们是不是应该看一下 imagenet 给数据的时候是给的什么样的数据
训练集 测试集 和校验集 看看sh 文件里面都写了什么
加入在每个关键点周围取一个小patch,这个patch取多大比较好?
convnet 跟caffe 的区别是 convnet 用了cuda?
现在比较明确的是我们采用 5层的卷积网络:
每个