9W人脸清洗的问题--20170208

本文详细介绍了从9万个原始人脸数据进行清洗的过程,清洗后数据量增至500多万条。对比清洗前后的人脸数量,并提供了MATLAB验证方法。同时,文章还分享了如何根据清洗后的人脸列表复制相应图片至指定文件夹的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

新的一年开始了:

今年要做的事情:

A. 清洗的9W 个人脸 好像数据量少了很多。 找出来少的是那些。

     9W 个原始的人脸数据 经过清洗之后是500多W的人脸。

     我这边有两个list 到底是那个list 

      参考wuxiang 在网上发布的版本:
      https://github.com/AlfredXiangWu/face_verification_experiment

      清洗后的list 在:https://pan.baidu.com/s/1gfxB0iB 有153M 

      清洗之前有99891 多人,清洗之后有79077 这么多人。

      利用matlab 验证一下。

      A=importdata('G:/facedatabase/face_data/MS-Celeb-1M_clean_list.txt');
      u=unique(A.data);

       b = unique (a)         %取集合a的不重复元素构成的向量

       u 的个数为:79077 

      

A2. 切割后的人脸:

       切割后的样本有两个,第一个版本有黑图,第二个版本解决了这个问题。

       在第二个版本的基础上找出来清洗后人脸的图 copyfile 到I:\9Wface_zhengli_20170207

       这个文件夹下。没有检测到人脸的图片的list 放在no_inlcude170207.txt 下面。

       代码为:

       

A=importdata('G:/facedatabase/face_data/MS-Celeb-1M_clean_list.txt');
u=unique(A.data);
src='I:\9wface_crop\outdir0\MsCelebV1-Faces-Aligned';
dst='I:\9Wface_zhengli_20170207';
fid_noinclude=fopen('no_inlcude170207.txt','w');
[row column,channel]=size(A.data);
imagenum=0;
row
for i=1:row
    image_path=A.textdata{i};
    full_path_src=fullfile(src,image_path);
    full_path_dst=fullfile(dst,image_path);
    [path, name, exe] = fileparts(full_path_dst);
        if ~exist(path, 'dir')
            mkdir(path);
        end
    try
        copyfile(full_path_src,full_path_dst);
    catch
        fprintf(fid_noinclude,'%s\n',image_path);
        imagenum=imagenum+1
    end
end

fclose(fid_noinclude);

      

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值