前言:第一次接触视频分割相关的网络(RVOS,https://github.com/imatge-upc/rvos),发现网络dataloader的输出数据格式不是batch first,而是[length_of_clips, batch_size, channels, height, width]。经过实验发现:若Dataset返回tensor对象,则dataloader输出常规的[batch_size, length_of_clips, channels, height, width],(即batch first),若Dataset返回list对象,则dataloader输出[length_of_clips, batch_size, channels, height, width]
常规返回tensor或numpy的测试:
class DealDataset(Dataset):
def __init__(self):
self.x_data = torch.ones(6, 4, 5)
self.y_data = torch.ones(6, 4, 5)
# 或者
# self.x_data = np.ones((6, 4, 5))
# self.y_data = np.ones((6, 4, 5))
self.len = self.x_data.shape[0]
def __getitem__(self

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



