- 博客(5)
- 收藏
- 关注
原创 [CVPR 2024] FinePOSE 源码阅读(二):训练流程、数据流水线与可视化
在FinePOSE 源码阅读(一),我们分析了 FinePOSE 的核心模型代码(mixste_finepose.py)。这篇博客主要来读一下入口文件 main.py。这个文件负责整个项目的运行逻辑,包括怎么加载数据集、怎么构造 Prompt、以及训练和测试的具体流程。
2025-11-24 19:24:32
315
原创 [CVPR 2024] FinePOSE 源码阅读(一):核心模型架构与跨模态交互
在 3D 人体姿态估计领域,如何有效地利用文本语义信息一直是一个难点。CVPR 2024 的FinePOSE提出了一种基于扩散模型的细粒度提示驱动框架,通过引入 CLIP 和多层次的 Prompt 机制,显著提升了姿态估计的精度。本文将结合论文架构图,逐行解析FinePOSE 的核心代码实现(mixste_finepose.py),理解这个模型是如何一步步将文本、时间和空间信息融合在一起的。
2025-11-24 15:53:45
350
原创 【论文阅读笔记】Discovering “Semantics“ in Super-Resolution Networks
(如图b、图c)(作者由此。
2024-11-20 11:36:36
1953
1
原创 【论文阅读笔记】TR-MISR: Multiimage Super-Resolution Based on Feature Fusion With Transformers
卫星采集的图像序列往往具有多视角和较长的时间跨度,因此将多个低分辨率视图融合为一张细节丰富的高分辨率图像是一个具有挑战性的问题。然而,大多数基于深度学习的MISR方法无法充分利用多张图像进行融合。它们的融合模块——无法很好地适应时间相关性较弱的图像序列多图像超分辨率——提出该模型(编码器、融合模块、解码器)。主要解决输入图像顺序敏感和特征融合不足的问题。
2024-11-13 10:02:41
1576
2
原创 【论文阅读笔记】Accurate Image Super-Resolution Using Very Deep Convolutional Networks
VDSR模型学习
2024-11-06 09:42:01
479
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅