《视频压缩》—光流图的可视化和特征图的可视化

最新推荐文章于 2025-04-30 15:03:34 发布

qq_43574294

最新推荐文章于 2025-04-30 15:03:34 发布

阅读量412

点赞数

分类专栏：视频压缩文章标签：深度学习视频

本文链接：https://blog.youkuaiyun.com/qq_43574294/article/details/129789054

版权

视频压缩专栏收录该内容

1 篇文章

订阅专栏

文章介绍了如何查看和处理DVC/DCVC项目中的ME网络（基于SpyNet）生成的光流文件，特别是如何将estmv保存为.flo格式。在保存时需要注意输入格式应转换为array（h,w,c），并提供了相应的代码实现。此外，文章提到使用未训练好的网络可能导致光流图质量不佳，且与官方结果存在差异，这可能与训练和测试集的背景偏移有关。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

查看DVC/DCVC的ME网络（都是用的SpyNet网络）

找到DVC里面的flow文件，分析一下里面的函数的作用

所以怎么实现呢

将estmv保存为.flo的光流文件

在我的文件夹

from torchvision import transforms
import matplotlib.pyplot as plt
    def writeFlow(self,filename, uv, v=None):#注意输入格式应当是array/（h,w,c)
        TAG_CHAR = np.array([202021.25], np.float32)
        nBands = 2
        if v is None:
            assert (uv.ndim == 3)
            assert (uv.shape[2] == 2)
            u = uv[:, :, 0]
            v = uv[:, :, 1]
        else:
            u = uv  

        assert (u.shape == v.shape)
        height, width = u.shape
        f = open(filename, 'wb')
        # write the header
        f.write(TAG_CHAR)
        np.array(width).astype(np.int32).tofile(f)
        np.array(height).astype(np.int32).tofile(f)
        # arrange into matrix form
        tmp = np.zeros((height, width * nBands))
        tmp[:, np.arange(width) * 2] = u
        tmp[:, np.arange(width) * 2 + 1] = v
        tmp.astype(np.float32).tofile(f)
        f.close()
  
    def imShow(self , input,i):   
        tensor = transforms.ToPILImage()(input)
        tensor.save(("./src/flow_from_DVC/img{}.png".format(i)))

(69条消息) 光流.flo文件处理_光流文件存储形式_nulixuexidexiaojie的博客-优快云博客