发顶会！发发发！给我sota！-优快云博客

原创扩散模型模型结构整理（持续更新）

扩散模型的原理网上已经有很多解析了，但是目前扩散模型的结构设计以及改进也层出不穷，接下来就介绍一些经典或最新的结构，也是为了促使自己多看论文，快速入门。也欢迎小伙伴推荐补充～

2024-11-16 21:24:50 552

原创 diffusers用法(持续更新)

本文记录的diffusers的用法为版本0.17.0的，不同版本可能会有所不同.

2024-11-15 14:23:32 2158 3

原创从0阅读diffusers库代码（持续更新）

diffusers库是用stable diffusion一定要用的库之一。但是其实安装了该库，很多时候我也不知道该怎么用，在别人的GitHub的issue里问了很多傻傻的问题，最终思来想去，还是决定从0看一下其中的代码。那么下载好源码之后我们就可以看其中封装的各个类和各个函数了。

2024-06-12 21:43:49 2899

在文档图像矫正问题中，真实图像与失真图像存在着丰富的几何约束条件。然而，在现存的先进的解决方法中，这些几何约束大多数被忽略了，这大大限制了矫正的性能。为此，我们提出了DocGeoNet进行文档图像矫正，通过引入显式的几何表征。从技术上讲，所提出的几何表征学习中涉及文档图像的两个典型的属性，即3D形状和文本行。我们的动机来自于一种见解：3D形状为矫正一张扭曲的文档图像提供了全局unwarping线索，然而忽略了局部结构；另一方面，文本行互补地为局部图案提供了显示几何约束。

2023-08-20 21:15:20 938 1