情况:最近下载了两个人脸反欺诈的数据集(HQ-WMCA,WMCA),但是发现是hdf5文件,第一次遇到这样的数据集,无从下手,也在网上找了相关资料,都没有很直接解决问题,最终依靠实验室的大佬帮我这个小白解决了问题。
所需要的库
conda install h5py # 处理hdf5的包
WMCA数据集分为两个部分:RGB和CDIT
下面是完整的代码(根据自己的文件路径修改)
RGB部分:
import h5py,os
import matplotlib.pyplot as plt
import numpy as np
# 读取路径
path = r'E:\Dataset\WMCA\WMCA\preprocessed-face-station_RGB'
# 存储路径
path1 = r'E:\Dataset\WMCA\WMCA\RGB'
for dir_name in os.listdir(path):
dir_path = os.path.join(path, dir_name)
for hd5_name in os.listdir(dir_path):
hd5_path = os.path.join(dir_path, hd5_name)
with h5py.File(hd5_path, 'r') as f:
for k in f.keys():
# img &