深度学习训练数据处理（1）——.mat文件中提取训练图片

最新推荐文章于 2025-09-25 10:26:26 发布

原创

最新推荐文章于 2025-09-25 10:26:26 发布 · 9.2k 阅读

39 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #数据 #图片

在深度学习项目中，获取训练数据至关重要。本文介绍了如何处理.mat格式的数据集，特别是针对包含image和label的文件。通过在MATLAB环境下编写解码脚本，可以提取.image并修改.label，以适应特定任务需求。尽管解码后的图像文件名与原始.mat文件名不匹配，需要进一步进行批量重命名以保持与标签的一一对应关系，为后续的训练做好准备。

对于初学者来说，要实现目的要求，第一步就是要找到足够的训练数据，自己动手做训练数据是不现实的，毕竟工作量太大，那么另外一个思路就是对别人的数据库进行修改。标准数据库中如比较常用的VOC2012等里面已经有图片和label了，使用起来比较方便，但是特定场景下（如语义分割等）的数据一般都是.mat格式，里面包含了image，label等信息，要实现我自己的特定功能，就要对.mat文件进行修改。具体做法就是分别解码出.mat文件里面的image和label，修改label后，自己项目的训练数据也就得到了。

function output = imdecode( input, fmt, varargin )
%IMDECODE Decompress image data in the specified format
%
%    output = imencode(input)
%    output = imencode(input, fmt)
%
% IMDECODE decompresses binary array INPUT into image data OUTPUT using
% specified format FMT. FMT is a name of image file extension that is
% recognized by IMFORMATS function, such as 'jpg' or