处理svhn数据集的mat文件
导语
最近训练crnn需要使用svhn数据集,下载地址在这里,压缩包里包含一堆png格式的图片,一个.mat文件和一个.m文件,图片的label和bbox就在.mat文件中。
碰到的问题
scipy和h5py
mat格式的文件是matlab的数据保存标准格式。根据网上的教程,我首先用scipy库处理mat文件
import scipy.io as scio
data = scio.loadmat(r"D:\datasets\SVT\train\digitStruct.mat")
data.keys()
结果报了错Please use HDF reader for matlab v7.3 files

本文介绍了在训练crnn过程中遇到的处理SVHN数据集.mat文件的问题。由于文件采用v7.3格式,scipy无法读取,需借助h5py库。通过h5py,可以将.mat文件视为hdf5文件,其中digitStruct组包含bbox和name,分别存储图片的bbox信息、label和图片名称。
最低0.47元/天 解锁文章
244





