新的一年开始了:
今年要做的事情:
A. 清洗的9W 个人脸 好像数据量少了很多。 找出来少的是那些。
9W 个原始的人脸数据 经过清洗之后是500多W的人脸。
我这边有两个list 到底是那个list
参考wuxiang 在网上发布的版本:
https://github.com/AlfredXiangWu/face_verification_experiment
清洗后的list 在:https://pan.baidu.com/s/1gfxB0iB 有153M
清洗之前有99891 多人,清洗之后有79077 这么多人。
利用matlab 验证一下。
A=importdata('G:/facedatabase/face_data/MS-Celeb-1M_clean_list.txt');
u=unique(A.data);
b = unique (a)
u 的个数为:79077
A2. 切割后的人脸:
切割后的样本有两个,第一个版本有黑图,第二个版本解决了这个问题。
在第二个版本的基础上找出来清洗后人脸的图 copyfile 到I:\9Wface_zhengli_20170207
这个文件夹下。没有检测到人脸的图片的list 放在no_inlcude170207.txt 下面。
代码为:
A=importdata('G:/facedatabase/face_data/MS-Celeb-1M_clean_list.txt');
u=unique(A.data);
src='I:\9wface_crop\outdir0\MsCelebV1-Faces-Aligned';
dst='I:\9Wface_zhengli_20170207';
fid_noinclude=fopen('no_inlcude170207.txt','w');
[row column,channel]=size(A.data);
imagenum=0;
row
for i=1:row
image_path=A.textdata{i};
full_path_src=fullfile(src,image_path);
full_path_dst=fullfile(dst,image_path);
[path, name, exe] = fileparts(full_path_dst);
if ~exist(path, 'dir')
mkdir(path);
end
try
copyfile(full_path_src,full_path_dst);
catch
fprintf(fid_noinclude,'%s\n',image_path);
imagenum=imagenum+1
end
end
fclose(fid_noinclude);