🧩【一】Backbone结构启发(注重层次特征与表征能力)
1. “Autoregressive Sequence Modeling for 3D Medical Image Representation” (Siwen Wang et al.)
👉 尽管是3D任务,但其提出的自回归序列建模可类比于在2D backbone中引入跨层依赖建模机制(类似 ConvNext 或 Mamba 思想),
启发:你可以在 YOLOv12 的 backbone 中引入 Mamba block / Sequence-aware Conv block,强化通道间的依赖学习,让特征提取更全局化。
💡 推荐尝试:在C3k2或C2f位置插入 “ConvMamba” 模块(轻量化线性递归结构)。
🌊【二】下采样与多尺度特征改进(提升高低层特征互动)
2. “Thinking in Granularity: Dynamic Quantization for Image Super-Resolution by Intriguing Multi-Granularity Clues” (Mingshen Wang et al.)
👉 该论文提出多粒度信息交互机制,即不同分辨率/尺度的特征在动态量化下保持信息一致性。
启发:可借鉴“多粒度特征聚合”思想,用动态卷积或门控方式改造下采样路径,让每次下采样保留细粒度特征。
💡 可构思模块:Multi-Granularity DownSample (MGD),类似 FReLU+DynamicConv。

最低0.47元/天 解锁文章
629

被折叠的 条评论
为什么被折叠?



