对于初学者来说,要实现目的要求,第一步就是要找到足够的训练数据,自己动手做训练数据是不现实的,毕竟工作量太大,那么另外一个思路就是对别人的数据库进行修改。标准数据库中如比较常用的VOC2012等里面已经有图片和label了,使用起来比较方便,但是特定场景下(如语义分割等)的数据一般都是.mat格式,里面包含了image,label等信息,要实现我自己的特定功能,就要对.mat文件进行修改。具体做法就是分别解码出.mat文件里面的image和label,修改label后,自己项目的训练数据也就得到了。
function output = imdecode( input, fmt, varargin )
%IMDECODE Decompress image data in the specified format
%
% output = imencode(input)
% output = imencode(input, fmt)
%
% IMDECODE decompresses binary array INPUT into image data OUTPUT using
% specified format FMT. FMT is a name of image file extension that is
% recognized by IMFORMATS function, such as 'jpg' or

在深度学习项目中,获取训练数据至关重要。本文介绍了如何处理.mat格式的数据集,特别是针对包含image和label的文件。通过在MATLAB环境下编写解码脚本,可以提取.image并修改.label,以适应特定任务需求。尽管解码后的图像文件名与原始.mat文件名不匹配,需要进一步进行批量重命名以保持与标签的一一对应关系,为后续的训练做好准备。
最低0.47元/天 解锁文章
7081

被折叠的 条评论
为什么被折叠?



