- 博客(20)
- 收藏
- 关注
原创 【深度图像拼接学习8】DMHomo: Learning Homography with Diffusion Models
文章目录abstract and introduction方法1. 总览2. Diffusion Models2.1 原理(1)前向过程(3)反向生成2.2 DGM(1)前向过程(2) 反向扩散2.3 HEM图像预处理特征提取HEM 的总损失(1) 单应性估计损失(2) 主导平面掩码的生成的损失前段时间一直在忙毕设的深度学习框架,最近才完工开始训练,之后继续开新坑,看一下在UDIS++基础上做的一些创新性工作,即Iterative Deep Homography的相关工作。今天看刘帅成老师的一篇工作,
2024-12-31 12:41:04
1058
原创 【深度图像拼接学习7】Parallax-Tolerant Unsupervised Deep Image Stitching代码理解
中也提到了,用相对位移的估计代替homography的估计,对这2个点作差得到位移向量,使用4个顶点的位移向量就可以等效表示homography。相较于前作UDIS构造的求解DLT的方法,该作更加简单,而且在深度学习中更为有效,作者在文中使用的方式实际是预测4-pt的motion而不是Homography matrix的8个parameter,这一点在之前的文章。两大部分,一个定义了network的工作流,一个定义了NetWork的主体架构。两大部分,作者的代码结构非常清晰,后续改写等都非常的方便。
2024-12-17 13:55:33
1008
1
原创 【深度图像拼接学习6】Parallax-Tolerant Unsupervised Deep Image Stitching
老生常谈,traditional method方法倾向于利复杂的几何特征(如点、线、边等)以获得更好的性能。然而,这些特征仅适用于具有足够几何结构的特定自然场景。相比之下,深度拼接方案通过自适应学习鲁棒语义特征克服了不利条件,但它们无法处理较大的视差情况。为了解决这些问题,Nie提出了一种容错的无监督深度图像拼接技术(UDIS++)。主要包括:(1)iterative的warp方法:global homography+局部TPS;(2)生成引导缝合线的组合掩膜。实现拼接图像的无缝组合。
2024-12-15 21:28:30
1636
原创 【深度图像拼接学习4】基于Unsupervised Deep Image Stitching: Reconstructing Stitched Features to Images的思考
目前已经complete作者的stage1部分代码的改写与理解,后续打算训练一下看看效果。在看第二部分reconstruction之前开一篇新文章,因为我发现作者的第一部分alignment实际就是之前学者们在做的图像的配准(对齐)工作,因此这里打算去再看几篇文献加深对该方面的理解,便于后续着手进行改进。在这个时候接触到了上刘帅成教授的学术报告,因此就根据此进行相关理解。注:教授首先提出了stitching过程中的主要问题(个人感觉还是很精辟的,可以作为自己研究重点):重复纹理;无纹理/弱纹理;
2024-12-02 18:17:30
1061
原创 【深度图像拼接学习3】Unsupervised Deep Image Stitching: Reconstructing Stitched Features to Images源码理解
这几天主要任务是去看这个源代码,去理解他的整个框架便于后续改写,作者提供的官方版本是tensorflow的,代码结构上分成了实际两部分,首先是图像的image aligen,即图像粗对齐,以及reconstruction即重建部分。在本文中,我们将利用深度学习提取特征来实现单应性矩阵的估计,通过逐层提取的特征信息来构建单应性矩阵,最终实现多阶段、逐步细化的图像对齐过程。在训练过程中,我们不断地使用输入图像对训练模型,使其能够从图像中提取有效的特征,学习如何计算单应性矩阵,从而实现图像的对齐。
2024-11-22 19:16:55
924
原创 【深度图像拼接学习2】Unsupervised Deep Image Stitching: Reconstructing Stitched Features to Images文章初读
resolution分辨率不对齐eliminate删除artifact伪影变形作者在abstract中共介绍了以下3部分:1. traditonal and supervised learning 存在的问题:前者极其依赖feature detection(特征检测),且对于低分辨或低特征场景下效果不好。后者因为labeled data的 lack 所以发展一直受限。2.介绍了网络架构以及作者在内部的创新:这是一个two-stage的网络,第一阶段主要进行一个粗对齐。
2024-11-18 17:26:11
862
原创 【深度图像拼接学习01】基础概念学习
最近在进行毕业设计,阅读paper过程中,遇到了挺多专业名词的,由于之前对拼接领域不算太熟悉,因此有些概念上不太清楚,今天开个坑来更新相关内容。
2024-11-17 15:47:09
797
原创 扩充临界比例度法调参PID
最近在学PID调参,有感而发,于是想要趁此机会来写一篇。首先我们要知道工程上,扩充临界比例度法的步骤:截取书上的一段话,一般控制度选择1.05时候,数字控制器和模拟控制器控制效果相当。基于下表进行计算,可得 T=0.083,Kp = 5.355,Ti = 2.79,Td=0.83。接下来选取合适的采样时间,假设T=1;之后我们开始调整Kp,在8.5时出现等幅振荡。测量Ts,显然为5.963。
2024-05-18 22:17:58
635
原创 sklearn快速入门
一般在sklearn中可以通过调用train_test_split函数来完成对数据记得切分核心参数解释:test_size:测试集比例,默认0.25train_size:训练集比例, 默认0.75shuffle: 默认为True,即打乱参数random_state:设置随机数种子stratify:是否需要进行分层切分。
2024-04-18 20:02:31
319
1
原创 深度学习可视化工具下载与使用
这里给大家介绍一个深度学习过程中比较常用的工具TensorBorad工具的下载及使用。介绍:tensorboard使用跟jupyter lab基本一样,都是基于网页端的本地应用。
2023-11-29 00:13:36
463
1
原创 参数优化算法
深度学习中,参数优化是一个很重要的概念,为什么这么说?首先你需要指导你的预测结果跟你实际结果的偏差吧?那么你想要保证你的偏差最小,如何保证你的偏差最小,就需要优化算法。一般流程是什么,我们可以叫优化算法是正向传播过程,每次正向传播完,我们都反向传播算去他们的梯度,之后继续循环,直到目标函数条件满足,停止,得到目前的权重参数。
2023-11-26 20:02:27
1884
1
原创 数模数据分析—Pandas复习(1)
DataFrame是在导入文件后,最经常遇到的类型,其为二维数据。为了方便介绍,下面可以裸创建一个DataFrame去看操作,一般数模中导入就行。'''输出以结果0 1 2 3 4'''可看到DataFrame提供了index(axis=0)与Columns(axis=1)分别提供行列索引。同时该方法中可以改变index与columns的索引量不难看到结果输出如左图所示与上述相似,可以提取列索引与行索引通过index跟columns。
2023-09-18 21:09:39
97
原创 STM32学习日志(4)—RCC时钟与延时函数
STM32本身十分复杂,外设非常多,任何外设都需要时钟才能启动,但每个外设所需频率不尽相同,所以利用复杂的MCU采用多时钟源的方法来解决这些问题。时钟树主要分为三大部分:时钟输入源、选择器/分频器(APB)/倍频器、最终设定频率三大部分。
2023-08-25 19:50:24
262
1
原创 STM32学习日志(3)—HAL库的结构与使用
1) Core文件:里面包括Inc、Src、Startup三大部分,分别用来装.h文件、.C文件、以及会变启动文件。其中sys开头的这些文件主要是最底层的内核级文件。main.c为程序主函数。其中还有几个例如 .project表示cubeide工程的启动文件,.ioc为cubemx图形界面的启动文件,在此并未显示。TogglePin为翻转电平在这里,LED_BLUE_Pin为蓝灯所在的引脚,即执行该语句红灯应该闪烁。建议:之后每次再添加新外设新功能时候,都在相应文件夹下建立 .c/.h文件。
2023-08-24 16:05:34
414
1
原创 STM32学习日志(1)—stm32命名规范
H:BGA(Ball Crid Array)封装、T:LQFP封装、Y:WLCS64。下面以STM32F103C8T6为例来介绍。分别为:2,8,B,C,D,E,G,H。F:通用型号 ,同时也包括以下几类。8:工业温度范围 -40~105。6:工业温度范围 -40~85。ST公司规定的规范命名格式。ST— —意法半导体公司名。32:基于ARM的32位。1 03表示子系列,
2023-08-24 11:09:20
320
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人