caffe 读取数据

最新推荐文章于 2023-02-22 15:58:06 发布

原创最新推荐文章于 2023-02-22 15:58:06 发布 · 1.8k 阅读

1 ·

CC 4.0 BY-SA版权

Caffe 专栏收录该内容

47 篇文章

订阅专栏

本文介绍了使用Caffe进行多标签图像分类任务的两种方法：HDF5数据格式与Python层。HDF5数据格式便于将多标签数据输入Caffe模型，但文件体积可能较大；Python层方式更灵活，适合实现复杂的损失函数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

(1) HDF5数据

优点：

通常为了利用多标签数据（大部分网上介绍的），将数据准备为HDF5格式。
使用HDF5数据，可以很方便的传入任何数据到caffe，例如仅需在train.prototxt中用如下的形式：

layer {
   name: "data"
   type: "HDF5Data"
   top: "Features"  # normalzied images
   top: "Headposes" # label1
   top: "Genders"   # label2
   top: "Ages"      # label3
   top: "Landmarks" # label4
   hdf5_data_param {
     source: "../hdf5_file/train_list.txt" # do not give the h5 files directly, but the list.
     batch_size: 64
   }
   include { phase:TRAIN }
 }

缺点：

然而存储为HDF5数据通常采用single单精度，或者double双精度类型，使得数据量动不动就几个G或者几十个G，然而，同一图像数据，准备不同尺度，都需要再度生成HDF5数据格式。

(2) 利用python层

然而另外一个简洁的方式是，定义一个读取数据的python层，用来处理数据，有时间的话，在回来补充完整。
为了方便，贴出文献[1]中的读数据代码：

#coding=gbk
import caffe
import numpy as np
import scipy.io as io
from os.path import join, isfile
class LDLDataLayer(caffe.Layer):
    def setup(self, bottom, top):
        self.top_names = ['data', 'label']
        params = eval(self.param_str)
        self.db_name = params['db_name'] 
        self.batch_size = params['batch_size']
        self.split_idx = params['split_idx']
        self.phase = params['phase']
        if params.has_key('sub_mean'):
          self.sub_mean = params['sub_mean']
        else:
          self.sub_mean = False
        assert(self.split_idx <= 9)
        if isfile(join('data/ldl/DataSets/',self.db_name+'-shuffled.mat')): # 如果存储随机大量索引的则加载
            mat = io.loadmat(join('data/ldl/DataSets/',self.db_name+'-shuffled.mat'))
        else:
            mat = io.loadmat(join('data/ldl/DataSets/',self.db_name+'.mat'))
            data = mat['features']
            label = mat['labels']
            shuffle_idx = np.random.choice(label.shape[0], label.shape[0]) # 随机打乱label
            data = data[shuffle_idx, :]
            label = label[shuffle_idx, :]
            mat = dict({'features':data, 'labels':label})
            io.savemat(join('data/ldl/DataSets/',self.db_name+'-shuffled.mat'), mat)
        self.features = mat['features']
        self.labels = mat['labels']
        self.N, self.D1 = self.features.shape
        _, self.D2 = self.labels.shape
        self.N = int(np.floor(self.labels.shape[0]/10)*10) # 
        # discard extra samples # 为了完成 10 fold ，抛弃了额外的样本。
        self.features = self.features[0:self.N, :]
        self.labels = self.labels[0:self.N, :]
        Ntest = self.N / 10
        self.Ntrain = int(self.N - Ntest)
        if self.phase=='test':
            assert(self.batch_size == Ntest)
        train_test_filter = np.array([False] * self.N)
        train_test_filter[self.split_idx*Ntest:(self.split_idx+1)*Ntest] = True
        self.test_data = self.features[train_test_filter, :]
        self.test_label = self.labels[train_test_filter, :]
        self.train_data = self.features[np.logical_not(train_test_filter), :]
        self.train_label = self.labels[np.logical_not(train_test_filter), :]
        if self.sub_mean:
            print "Subtract mean ... "
            data_mean = np.mean(self.train_data, 0)
            self.train_data = self.train_data - np.tile(data_mean, [self.train_data.shape[0], 1])
            self.test_data = self.test_data - np.tile(data_mean, [self.test_data.shape[0], 1])
        top[0].reshape(self.batch_size,self.D1,1,1)
        top[1].reshape(self.batch_size,self.D2,1,1)

    def forward(self, bottom, top):
        if self.phase == 'train':
            rnd_select = np.random.choice(self.Ntrain, self.batch_size)
            top[0].data[:,:,0,0] = self.train_data[rnd_select, :]
            top[1].data[:,:,0,0] = self.train_label[rnd_select, :]
        elif self.phase == 'test':
            top[0].data[:,:,0,0] = self.test_data
            top[1].data[:,:,0,0] = self.test_label

    def reshape(self, bottom, top):
        pass

    def backward(self, top, propagate_down, bottom):
        pass