Tensorflow2.* Keras 视频5维输入 shape调整 tf.reshape()

本文介绍了在Tensorflow2.x中处理五维视频输入的两种方法,重点推荐使用reshape策略。通过tf.reshape将视频数据前两维展平,以适应Keras模型输入。尽管解决方案一采用维度切片堆叠,但当视频帧数较大时,建模和训练过程中可能会导致性能问题。reshape方法则能有效避免这些问题,同时保持数据原有的顺序。

视频输入问题

传统的图像网络的输入数据格式input_shape =(batch, h, w, c),但对于视频输入(batch, number_frames, h, w, c)。我们在keras建模的时候batch_size默认为input_shape[0],无法改变,同时keras.layers.Conv2d等层操作也是按照4维张量处理输入输入。

解决方案一:维度切片堆叠(不推荐)

在模型搭建的过程中,在number_frames维度进行堆叠,即在喂给keras.layers.Conv2d前将数据按number_frames维切片,输出后再进行堆叠。

    for ii in range (input_shape[0]):
        if ii==0:
            coarse_out=coarse_model(videoclip_cropped[:,ii])
        else:
            coarse_out=concatenate([coarse_out,coarse_model(videoclip_cropped[:,ii])], axis
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值