高清人脸数据集—FFHQ

FFHQ:英伟达高清人脸数据集详解与应用
FFHQ是英伟达开发的高分辨率人脸数据集,用于训练GAN模型,包含70000张多样化人脸图片,可用于人脸属性分析和分割。介绍数据来源、组织结构与下载方法,以及其在AI研究中的作用。

FFHQ全称Flickr-Faces-Hight-Quality(Flickr-Faces-HQ)是英伟达作为生成对抗网络(GAN)的基准创建的,也用于Style GAN的训练数据集中,于2019年开源。FFHQ是一个高质量的人脸数据集,包含1024x1024分辨率的70000张PNG格式高清人脸图像,在年龄、种族和图像背景上丰富多样且差异明显,在人脸属性上也拥有非常多的变化,拥有不同的年龄、性别、种族、肤色、表情、脸型、发型、人脸姿态等,包括普通眼镜、太阳镜、帽子、发饰及围巾等多种人脸周边配件,因此该数据集也是可以用于开发一些人脸属性分类或者人脸语义分割模型的。FFHQ的图像从Flickr上爬取,且均有许可才会下载,并使用了dlib进行人脸对齐和裁剪,之后使用算法移除了一些非真实人脸如雕像、画作及照片等图像。
在这里插入图片描述

Flickr [1-2] ,雅虎旗下图片分享网站。为一家提供免费及付费数位照片储存、分享方案之线上服务,也提供网络社群服务的平台。其重要特点就是基于社会网络的人际关系的拓展与内容的组织。这个网站的功能之强大,已超出了一般的图片服务,比如图片服务、联系人服务、组群服务。

FFHQ高清人脸数据集主要存储于谷歌云盘。
在这里插入图片描述
数据集统计分析:
在这里插入图片描述
对于需要单独训练和验证集的用例,指定了前 60,000 张图像用于训练,其余 10,000 张图像用于验证。 然而,在 StyleGAN 论文中,使用了所有 70,000 张图像进行训练。

已经明确确保数据集中没有重复的图像。 但是,请注意,如果从同一图像中提取了多个不同的人脸,则 in-the-wild 文件夹可能包含同一图像的多个副本。

可以直接从 Google Drive 获取数据,也可以使用提供的下载脚本。 该脚本通过自动下载所有请求的文件、验证它们的校验和、在出错时多次重试每个文件以及使用多个并发连接来最大化带宽,使事情变得更加容易。

> python download_ffhq.py -h
usage: download_ffhq.py [-h] [-j] [-s] [-i] [-t] [-w] [-r] [-a]
                        [--num_threads NUM] [--status_delay SEC]
                        [--timing_window LEN] [--chunk_size KB]
                        [--num_attempts NUM]

Download Flickr-Face-HQ (FFHQ) dataset to current working directory.

optional arguments:
  -h, --help           show this help message and exit
  -j, --json           download metadata as JSON (254 MB)
  -s, --stats          prin
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值