动态滤波器（动态卷积网络）

最新推荐文章于 2025-07-14 13:59:47 发布

gwpscut

最新推荐文章于 2025-07-14 13:59:47 发布

阅读量7.7k

点赞数 1

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gwplovekimi/article/details/89047675

深度学习专栏收录该内容

63 篇文章

订阅专栏

介绍了一种新型框架——动态过滤器网络，该网络可以根据输入动态生成过滤器，增强了模型的灵活性和适应性。过滤器生成网络根据输入生成特定的过滤参数，而动态过滤层则应用这些过滤器于输入上。此外，还提出了一种特殊的动态局部过滤层，不仅能够生成特定于样本的过滤器，还能生成特定于位置的过滤器。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在传统的卷积层中，学习的滤波器在训练后保持固定。相反，我们引入了一个新的框架，动态过滤器网络，其中过滤器是根据输入动态生成的。结果表明，该体系结构是一个完整的体系结构，具有一定的灵活性和适应性，但没有过多的增加模型参数。通过这种方式可以学习各种各样的过滤操作，包括局部空间转换，也可以学习选择性模糊或自适应特征提取。此外，可以组合多个这样的层，例如在一个循环架构中。

我们的动态过滤模块由两个部分组成:过滤器生成网络和动态过滤层(见图1)，过滤器生成网络根据网络s的输入动态生成特定于样本的过滤参数。请注意，这些在训练后是不固定的，就像常规的模型参数一样。动态过滤层然后将这些特定于示例的过滤器应用于输入。动态过滤模块的两个组件相对于模型参数都是可微分的，这样梯度就可以在整个网络中反向传播。过滤器可以是卷积的，但也可以有其他选项。特别地，我们提出了一种特殊的动态滤波层，即我们铸造的动态局部滤波层，它不仅是特定于样本的，而且是特定于位置的。在这种情况下，过滤器会随着位置和样本的不同而变化，从而允许对输入进行更复杂的操作。我们的框架可以同时了解空间和光度的变化，因为像素不是简单地移位，而是过滤器可能作用于整个邻域。

动态过滤模块由一个过滤生成网络和一个动态过滤层组成，前者生成以输入为条件的过滤器，后者将生成的过滤器应用于另一个输入。动态滤波器模块的两个组件都是可微分的。