胡说八道的Dr. Zhu-优快云博客

原创扩散模型论文概述（三）：Stability AI系列工作【学习笔记】

右图展示了不同尺寸控制条件下生成的图像对比效果，可以看到引入尺寸作为输入的控制条件，随着尺寸大小增加，图像的质量显著提升。值得注意的是，以上所有模型都是使用相同的LDM架构进行训练的，只需要调整LDM中的条件控制编码器，就能接受各种不同类型的条件输入。同时SD 3做了大量的对比实验，探索了多模态DiT的Scaling Law，发现基于DiT的文生图模型与大模型一样，也具有Scaling Law的规律。LDM中继承了VQGAN中对图像进行压缩的思想，相较于DDPM，极大的减少了计算量。

2025-01-06 16:44:31 1056

原创扩散模型论文概述（二）：Google系列工作【学习笔记】

视频链接：扩散模型论文概述（二）：Google系列工作_哔哩哔哩_bilibili同样，第一张图片是神作，总结的太好了！

2025-01-05 16:06:55 573

原创扩散模型论文概述（一）：OpenAI系列工作【学习笔记】

（up主讲的非常好，通俗易懂，值得推荐）

2025-01-05 10:32:36 284

原创如何将视频转换为一张一张的图片【科研小技巧】

网上有利用Photoshop实现的，还有利用一些转换工具实现的，本博客中利用Python代码实现，利用opencv-python库将视频逐帧提取为一张张图片。在做图像修复的过程中，看到网上有一段视频满足要求，如何将该视频转化为一张张的图片，并保存到本地文件夹。

2024-12-23 08:59:40 495

原创利用PPT进行科研绘图时，如何导出高分辨率图片【科研小技巧】

6、双击打开ExportBitmapResolution，选择“十进制”，设置数值数据为600即可（数值越大越清晰，office 2016最大可以到1200。7、打开PPT，进入要生成图片的页面，点击左上角的文件，点击另存为，选择保存的路径，在保存类型中选择 JPEG文件交换格式(*.jpg)，再点击保存即可。撰写论文时，利用PPT绘制论文中的图片，图片绘制完成以后，如何导出高分辨率图片以满足出版要求呢？2、按“win+R“键，调出运行窗口，输入regedit，再点击确定。

2024-12-21 21:48:09 665

原创文献鸟stork：最新科研文献推送工具【科研小技巧】

5、在主界面的关键词列表下方有设置频率和发送时间，按照需求进行设置即可。设置完成以后，文献鸟就会按照要求推送最新科研文献了。如果现在就需要，点击单击这里按钮，就会给你的邮箱发送一封最新科研文献推送的邮件。ref=460183，输入用于接收文献推送的邮箱，完成注册。根据需要选择最合适的推荐关键词即可，点击下一步完成添加。2、登录进来以后，在主界面有再添加一个关键词模块，输入你感兴趣的关键词即可。3、以扩散模型为例，输入Diffusion model，再点击添加。

2024-12-19 15:33:14 1006

原创拿到一篇论文，如何查看该论文提交到arXiv上的时间【科研小技巧】

2、在右上角的搜索框输入要检索的文章标题并进行检索，以Understanding Diffusion Models: A Unified Perspective这篇论文为例。3、检索到文章后，可以看到文章标题的正上方有个[Submitted on 25 Aug 2022]，表示该文章在2022年8月25日提交到arXiv上的。4、在下载的PDF论文中，在第一页可以看到有一个 25 Aug 2022，同样表示该论文是在2022年8月25日提交到arXiv上的。

2024-12-18 22:27:14 1025

原创 DALL·E 2（内含扩散模型介绍）-生成式模型【学习笔记】

生成式模型

2024-12-16 16:20:48 1155

原创【图像去雾数据集】RTTS真实世界任务驱动测试集数据介绍

RTTS（Real-world Task-Driven Testing Set）真实世界任务驱动数据集由华中科大、中科院、中科大等多家单位联合发布，是RESIDE数据集中的测试集。RTTS从网络上收集了4322张真实世界的模糊图像，主要涵盖了交通和驾驶场景。实际下载的RTTS数据集中，包括Annotations、ImageSets和JPEGImages三个子文件夹。其中，JPEGImages文件夹中包含4322张有雾图像；本博客主要站在使用者角度简单介绍RTTS数据集，想了解更详细的内容请看原始论文！

2024-12-15 10:43:45 1391

原创【图像去雾数据集】OTS室外合成数据集介绍

haze文件夹中包含part1、part2、part3、part4四个子文件夹，part1文件夹中包含18200张合成的有雾图像，part2文件夹中也包含18200张合成的有雾图像，part3文件夹中同样包含18200张合成的有雾图像，part4文件夹中包含17535张合成的有雾图像；haze文件夹下四个子文件夹中总的有雾图像的数量为：18200 + 18200 + 18200 + 17535 = 72135。OTS包含313,950张从真实户外场景中收集到的合成的图像，但不包含深度信息。

2024-12-15 09:46:29 902

原创【图像去雾数据集】HSTS混合主观测试数据集介绍

其中，real-world文件夹中包含10张真实世界的雾霾图像；synthetic文件夹下又包含original和synthetic两个子文件夹，original文件夹中包含10张室外的无雾图像，synthetic文件夹中包含10张合成的有雾图像，synthetic文件夹中的有雾图像是在original文件夹中无雾图像的基础上合成的。HSTS数据集选取与OTS数据集相同的方式生成10张室外合成雾霾图像，与10张真实世界的雾霾图像进行组合，供人类主观评价。

2024-12-14 21:56:33 596

原创【图像去雾数据集】ITS室内合成数据集介绍

其中，train文件夹下又包括ITS_clear、ITS_haze和ITS_trans三个子文件夹，ITS_clear中有10000张无雾图像，ITS_haze中有100000张合成的有雾图像，ITS_trans中同样也有100000张图像，ITS_clear中的每一张无雾图像对应ITS_haze中10张不同雾霾程度的有雾图像。val文件夹下也包括clear、haze和trans三个子文件夹，clear中有1000张无雾图像，hazy中有10000张合成的有雾图像，trans中同样也有10000张图像。

2024-12-13 11:12:26 1103

原创【图像去雾数据集】SOTS合成目标测试集数据介绍

SOTS（synthetic objective testing set）数据集由华中科大、中科院、中科大等多家单位联合发布，是RESIDE数据集中的测试集，与之相对应的是ITS（indoor training set）数据集，ITS数据集是RESIDE数据集中的训练集。SOTS数据集从NYU2中选择500个室内图像（与训练图像不重叠），并按照与训练数据相同的过程来合成模糊图像。此外，由于该数据集中的有雾图像没有对应的无雾图像，因此，在验证去雾算法性能的过程中，该数据集只能用于主观评价。

2024-12-13 10:17:00 1187

原创【图像去雾数据集】D-HAZY数据集介绍

解压后的D-HAZY数据集文件中包含4个子文件夹：Middlebury_GT、Middlebury_Hazy、NYU_GT、NYU_Hazy。其中，Middlebury_Hazy和Middlebury_GT是相对应的有雾和无雾图像，分别包含23个样本；NYU_Hazy和NYU_GT是相对应的有雾和无雾图像，分别包含1449个样本。D-HAZY数据集由鲁汶大学、赫罗纳大学和蒂米什瓦拉理工大学联合发布，建立在Middelbury 和NYU深度数据集上，基于大气散射模型和图像深度信息合成的有雾数据集。

2024-12-12 09:53:25 591

原创【图像去雾数据集】URHI未注释的真实世界朦胧图像数据集介绍

URHI数据集由华中科大、中科院、中科大等联合发布，是无标注的真实世界有雾图像数据集。URHI数据集是在真实场景下通过摄像机直接拍摄的。此外，由于该数据集中的有雾图像没有对应的无雾图像，因此，在验证去雾算法性能的过程中，只能用于主观评价。1、陈海秀,黄仔洁,陆康,等.基于特征增强的双重注意力去雾网络[J/OL].电光与控制,1-9[2024-12-11].本博客主要站在使用者角度简单介绍URHI数据集，想了解更详细的内容请看原始论文！

2024-12-11 19:21:03 614

原创【图像去雾数据集】HazeRD数据集介绍

RainDrop数据集由包含完全相同的场景的图像对组成，其中一张图像有雨滴覆盖，而另一张没有雨滴。为了达到这种效果，摄影师需要透过两片完全相同的玻璃进行拍摄，其中一块玻璃喷了水，而另一块玻璃则保持干净（相机为索尼 A6000 和佳能 EOS 60）。该数据集由 1,119 对图像对组成，图像包括了各种背景和雨滴。在RainDrop数据集中，有train、test_a和test_b三个文件夹，train文件夹中包含861个图像对，test_a文件夹中包含58个图像对，test_b文件夹中包含249个图像对。

2024-12-11 14:44:38 777

原创【图像去雨雾数据集】Outdoor-Rain数据集介绍

在Test1文件夹中，包含input和gt两个子文件夹，均由750张图像组成，图像名称从im_0301_***.png到im_0350_***.png。RainDrop数据集由包含完全相同的场景的图像对组成，其中一张图像有雨滴覆盖，而另一张没有雨滴。该数据集由 1,119 对图像对组成，图像包括了各种背景和雨滴。在RainDrop数据集中，有train、test_a和test_b三个文件夹，train文件夹中包含861个图像对，test_a文件夹中包含58个图像对，test_b文件夹中包含249个图像对。

2024-12-10 21:40:16 777

原创【图像去雨滴数据集】RainDrop数据集介绍

RainDrop数据集由包含完全相同的场景的图像对组成，其中一张图像有雨滴覆盖，而另一张没有雨滴。为了达到这种效果，摄影师需要透过两片完全相同的玻璃进行拍摄，其中一块玻璃喷了水，而另一块玻璃则保持干净（相机为索尼 A6000 和佳能 EOS 60）。该数据集由 1,119 对图像对组成，图像包括了各种背景和雨滴。在RainDrop数据集中，有train、test_a和test_b三个文件夹，train文件夹中包含861个图像对，test_a文件夹中包含58个图像对，test_b文件夹中包含249个图像对。

2024-12-10 17:18:44 808

原创深度学习中的数学基础【学习笔记】——第八章：数据科学你得知道的几种分布

UP主讲解的非常好，受益匪浅，总结课程内容以供复习。

2024-12-09 10:36:13 148

原创深度学习中的数学基础【学习笔记】——第七章：概率论基础

UP主讲解的非常好，受益匪浅，总结课程内容以供复习。

2024-12-08 21:10:07 411

原创深度学习中的数学基础【学习笔记】——第六章：随机变量

UP主讲解的非常好，受益匪浅，总结课程内容以供复习。

2024-12-08 17:09:13 365

原创深度学习中的数学基础【学习笔记】——第五章：特征值与矩阵分解

UP主讲解的非常好，受益匪浅，总结课程内容以供复习。

2024-12-08 10:53:19 348

原创深度学习中的数学基础【学习笔记】——第四章：线性代数基础

视频链接：高等数学、线性代数、微积分、概率论.…终于有人把深度学习的数学知识点讲透彻了！ UP主讲解的非常好，受益匪浅，总结课程内容以供复习。目录1、行列式概述2、矩阵与数据的关系3、矩阵基本操作4、矩阵的几种变换5、矩阵的秩6、内积与正交

2024-12-08 09:59:52 435

原创深度学习中的数学基础【学习笔记】——第三章：泰勒公式与拉格朗日

UP主讲解的非常好，受益匪浅，总结课程内容以供复习。

2024-12-07 22:18:04 637

原创深度学习中的数学基础【学习笔记】——第二章：微积分

UP主讲解的非常好，受益匪浅，总结课程内容以供复习。

2024-12-07 20:04:54 439

原创深度学习中的数学基础【学习笔记】——第一章：高等数学基础

UP主讲解的非常好，受益匪浅，总结课程内容以供复习。

2024-12-07 16:58:18 505

原创研究生第一篇文献综述怎么写，文献检索，文章整理，文献归纳高效方法小技巧【学习笔记】

UP主讲解的非常好，受益匪浅，总结课程内容以供复习。关于综述撰写的一些问题。

2024-12-06 08:54:10 1066

原创如何下载arXiv网站中论文的原始图片【科研小技巧】

4、点击Source栏的Download source按钮，会下载一个名为arXiv-2308.10510v2.tar.gz的压缩包（不同论文压缩包名称不同）。3、检索到文章后，点击右侧的Other Formats。2、在右上角的搜索框输入要检索的文章标题并进行检索。5、解压压缩包即可获得论文中的原始图片。

2024-12-05 09:39:11 995

原创如何高效写论文-学习笔记【AI算法研究猿James】

视频里面广告内容较多，为便于复习回顾，现对学习内容进行记录。

2024-12-04 21:05:05 402

原创图像修复算法常用评估指标介绍及Python代码（PSNR/SSIM/FID）

SSIM基于滑动窗口实现计算，即每次计算时从图片上取一个尺寸为N×N的窗口，基于窗口计算SSIM的值，遍历整张图像后再对所有窗口的值取平均，得出整张图像的SSIM值。FID是一种常用于评估图像生成模型和修复算法性能的指标，是目前广泛使用的评估指标之一。SSIM是另一个衡量图像质量的指标，它考虑了亮度、对比度和结构信息之间的相似性。最好的情况是FID=0，表示两个图像完全相同。PSNR值越高，表示修复图像与原始图像越接近。为修复图像和对应真实图像的均方误差。的特征向量之间距离的一种度量。

2024-12-04 09:31:05 1236

原创如何借助ChatGPT高效生成PPT

案例：请帮我制作一个以“基于深度学习的图像去雾发展历程”为主题的PPT文档，需遵循以下规则：1、有封面和副标题2、有内容大纲3、至少10页4、以Markdown格式输出。

2024-11-26 20:04:52 1021

原创【图像去雾数据集】NH-HAZE真实非均匀雾图像数据集介绍

NH-HAZE数据集是由蒂米什瓦拉理工大学、赫罗纳大学和瑞士苏黎世联邦理工大学计算机视觉实验室创建，是第一个包含非均匀雾霾场景的去雾数据集，包含55对真实的有雾霾和对应的无雾霾户外图像。雾霾图像是在使用专业雾霾机器产生的真实雾霾条件下拍摄的。本博客主要站在使用者角度简单介绍NH-HAZE数据集，想了解更详细的内容请看原始论文（文中还描述了很多采集图像的细节，如采用什么型号的雾霾产生机器、采用什么型号的相机拍摄照片等）！该机器能够高保真地模拟真实的雾霾条件。

2024-11-23 21:04:26 799

原创【图像去雾数据集】Dense-Haze真实浓雾图像数据集介绍

Dense-Haze数据集是由蒂米什瓦拉理工大学、赫罗纳大学和瑞士苏黎世联邦理工大学计算机视觉实验室创建，包含33对真实的有雾霾和对应的无雾霾图像（下载的数据集中，有55对图像。雾霾图像是在使用专业雾霾机器产生的真实雾霾条件下拍摄的。本博客主要站在使用者角度简单介绍Dense-Haze数据集，想了解更详细的内容请看原始论文（文中还描述了很多采集图像的细节，如采用什么型号的雾霾产生机器、采用什么型号的相机拍摄照片等）！此外，由于图像是在受控环境中采集的，因此有雾和无雾图像都是在相同的照明条件下捕获的。

2024-11-23 20:09:29 1070

原创【图像去雾数据集】O-Haze真实户外图像数据集介绍

O-HAZE数据集由西班牙巴塞罗那自治大学和德国慕尼黑工业大学联合发布，是第一个户外场景的数据集，包含45对有雾霾和对应的无雾霾图像，这些图像来源于45个不同的户外场景。其中，雾霾图像是在使用专业雾霾机器产生的真实雾霾条件下拍摄的。本博客主要站在使用者角度简单介绍O-HAZE数据集，想了解更详细的内容请看原始论文（文中还描述了很多采集图像的细节，如采用什么型号的雾霾产生机器、采用什么型号的相机拍摄照片等）！此外，由于图像是在受控环境中采集的，因此有雾和无雾图像都是在相同的照明条件下捕获的。

2024-11-23 09:10:36 1032

原创【图像去雾数据集】I-Haze真实室内图像数据集介绍

2018年，CVPR下NTIRE（New Trends in Image Restoration and Enhancement）研讨会举办针对真实雾场景的目标检测挑战赛，I-HAZE数据集被选为挑战赛数据集。I-HAZE数据集对应论文：I-HAZE: a dehazing benchmark with real hazy and haze-free indoor images（ACIVS 2018）该机器能够高保真地模拟真实的雾霾条件。其中，雾霾图像是在使用专业雾霾机器产生的真实雾霾条件下拍摄的。

2024-11-22 22:07:22 953

空空如也

空空如也