- 博客(43)
- 收藏
- 关注
原创 扩散模型论文概述(三):Stability AI系列工作【学习笔记】
右图展示了不同尺寸控制条件下生成的图像对比效果,可以看到引入尺寸作为输入的控制条件,随着尺寸大小增加,图像的质量显著提升。值得注意的是,以上所有模型都是使用相同的LDM架构进行训练的,只需要调整LDM中的条件控制编码器,就能接受各种不同类型的条件输入。同时SD 3做了大量的对比实验,探索了多模态DiT的Scaling Law,发现基于DiT的文生图模型与大模型一样,也具有Scaling Law的规律。LDM中继承了VQGAN中对图像进行压缩的思想,相较于DDPM,极大的减少了计算量。
2025-01-06 16:44:31
1056
原创 扩散模型论文概述(二):Google系列工作【学习笔记】
视频链接:扩散模型论文概述(二):Google系列工作_哔哩哔哩_bilibili同样,第一张图片是神作,总结的太好了!
2025-01-05 16:06:55
573
原创 如何将视频转换为一张一张的图片【科研小技巧】
网上有利用Photoshop实现的,还有利用一些转换工具实现的,本博客中利用Python代码实现,利用opencv-python库将视频逐帧提取为一张张图片。在做图像修复的过程中,看到网上有一段视频满足要求,如何将该视频转化为一张张的图片,并保存到本地文件夹。
2024-12-23 08:59:40
495
原创 利用PPT进行科研绘图时,如何导出高分辨率图片【科研小技巧】
6、双击打开ExportBitmapResolution,选择“十进制”,设置数值数据为600即可(数值越大越清晰,office 2016最大可以到1200。7、打开PPT,进入要生成图片的页面,点击左上角的文件,点击另存为,选择保存的路径,在保存类型中选择 JPEG文件交换格式(*.jpg),再点击保存即可。撰写论文时,利用PPT绘制论文中的图片,图片绘制完成以后,如何导出高分辨率图片以满足出版要求呢?2、按“win+R“键,调出运行窗口,输入regedit,再点击确定。
2024-12-21 21:48:09
665
原创 文献鸟stork:最新科研文献推送工具【科研小技巧】
5、在主界面的关键词列表下方有 设置频率和发送时间,按照需求进行设置即可。设置完成以后,文献鸟就会按照要求推送最新科研文献了。如果现在就需要,点击 单击这里 按钮,就会给你的邮箱发送一封最新科研文献推送的邮件。ref=460183,输入用于接收文献推送的邮箱,完成注册。根据需要选择最合适的推荐关键词即可,点击下一步完成添加。2、登录进来以后,在主界面有 再添加一个关键词 模块,输入你感兴趣的关键词即可。3、以扩散模型为例,输入Diffusion model,再点击添加。
2024-12-19 15:33:14
1006
原创 拿到一篇论文,如何查看该论文提交到arXiv上的时间【科研小技巧】
2、在右上角的搜索框输入要检索的文章标题并进行检索,以Understanding Diffusion Models: A Unified Perspective这篇论文为例。3、检索到文章后,可以看到文章标题的正上方有个[Submitted on 25 Aug 2022],表示该文章在2022年8月25日提交到arXiv上的。4、在下载的PDF论文中, 在第一页可以看到有一个 25 Aug 2022,同样表示该论文是在2022年8月25日提交到arXiv上的。
2024-12-18 22:27:14
1025
原创 【图像去雾数据集】RTTS真实世界任务驱动测试集数据介绍
RTTS(Real-world Task-Driven Testing Set)真实世界任务驱动数据集由华中科大、中科院、中科大等多家单位联合发布,是RESIDE数据集中的测试集。RTTS从网络上收集了4322张真实世界的模糊图像,主要涵盖了交通和驾驶场景。实际下载的RTTS数据集中,包括Annotations、ImageSets和JPEGImages三个子文件夹。其中,JPEGImages文件夹中包含4322张有雾图像;本博客主要站在使用者角度简单介绍RTTS数据集,想了解更详细的内容请看原始论文!
2024-12-15 10:43:45
1391
原创 【图像去雾数据集】OTS室外合成数据集介绍
haze文件夹中包含part1、part2、part3、part4四个子文件夹,part1文件夹中包含18200张合成的有雾图像,part2文件夹中也包含18200张合成的有雾图像,part3文件夹中同样包含18200张合成的有雾图像,part4文件夹中包含17535张合成的有雾图像;haze文件夹下四个子文件夹中总的有雾图像的数量为:18200 + 18200 + 18200 + 17535 = 72135。OTS包含313,950张从真实户外场景中收集到的合成的图像,但不包含深度信息。
2024-12-15 09:46:29
902
原创 【图像去雾数据集】HSTS混合主观测试数据集介绍
其中,real-world文件夹中包含10张真实世界的雾霾图像;synthetic文件夹下又包含original和synthetic两个子文件夹,original文件夹中包含10张室外的无雾图像,synthetic文件夹中包含10张合成的有雾图像,synthetic文件夹中的有雾图像是在original文件夹中无雾图像的基础上合成的。HSTS数据集选取与OTS数据集相同的方式生成10张室外合成雾霾图像,与10张真实世界的雾霾图像进行组合,供人类主观评价。
2024-12-14 21:56:33
596
原创 【图像去雾数据集】ITS室内合成数据集介绍
其中,train文件夹下又包括ITS_clear、ITS_haze和ITS_trans三个子文件夹,ITS_clear中有10000张无雾图像,ITS_haze中有100000张合成的有雾图像,ITS_trans中同样也有100000张图像,ITS_clear中的每一张无雾图像对应ITS_haze中10张不同雾霾程度的有雾图像。val文件夹下也包括clear、haze和trans三个子文件夹,clear中有1000张无雾图像,hazy中有10000张合成的有雾图像,trans中同样也有10000张图像。
2024-12-13 11:12:26
1103
原创 【图像去雾数据集】SOTS合成目标测试集数据介绍
SOTS(synthetic objective testing set)数据集由华中科大、中科院、中科大等多家单位联合发布,是RESIDE数据集中的测试集,与之相对应的是ITS(indoor training set)数据集,ITS数据集是RESIDE数据集中的训练集。SOTS数据集从NYU2中选择500个室内图像(与训练图像不重叠),并按照与训练数据相同的过程来合成模糊图像。此外,由于该数据集中的有雾图像没有对应的无雾图像,因此,在验证去雾算法性能的过程中,该数据集只能用于主观评价。
2024-12-13 10:17:00
1187
原创 【图像去雾数据集】D-HAZY数据集介绍
解压后的D-HAZY数据集文件中包含4个子文件夹:Middlebury_GT、Middlebury_Hazy、NYU_GT、NYU_Hazy。其中,Middlebury_Hazy和Middlebury_GT是相对应的有雾和无雾图像,分别包含23个样本;NYU_Hazy和NYU_GT是相对应的有雾和无雾图像,分别包含1449个样本。D-HAZY数据集由鲁汶大学、赫罗纳大学和蒂米什瓦拉理工大学联合发布,建立在Middelbury 和NYU深度数据集上,基于大气散射模型和图像深度信息合成的有雾数据集。
2024-12-12 09:53:25
591
原创 【图像去雾数据集】URHI未注释的真实世界朦胧图像数据集介绍
URHI数据集由华中科大、中科院、中科大等联合发布,是无标注的真实世界有雾图像数据集。URHI数据集是在真实场景下通过摄像机直接拍摄的。此外,由于该数据集中的有雾图像没有对应的无雾图像,因此,在验证去雾算法性能的过程中,只能用于主观评价。1、陈海秀,黄仔洁,陆康,等.基于特征增强的双重注意力去雾网络[J/OL].电光与控制,1-9[2024-12-11].本博客主要站在使用者角度简单介绍URHI数据集,想了解更详细的内容请看原始论文!
2024-12-11 19:21:03
614
原创 【图像去雾数据集】HazeRD数据集介绍
RainDrop数据集由包含完全相同的场景的图像对组成,其中一张图像有雨滴覆盖,而另一张没有雨滴。为了达到这种效果,摄影师需要透过两片完全相同的玻璃进行拍摄,其中一块玻璃喷了水,而另一块玻璃则保持干净(相机为索尼 A6000 和佳能 EOS 60)。该数据集由 1,119 对图像对组成,图像包括了各种背景和雨滴。在RainDrop数据集中,有train、test_a和test_b三个文件夹,train文件夹中包含861个图像对,test_a文件夹中包含58个图像对,test_b文件夹中包含249个图像对。
2024-12-11 14:44:38
777
原创 【图像去雨雾数据集】Outdoor-Rain数据集介绍
在Test1文件夹中,包含input和gt两个子文件夹,均由750张图像组成,图像名称从im_0301_***.png到im_0350_***.png。RainDrop数据集由包含完全相同的场景的图像对组成,其中一张图像有雨滴覆盖,而另一张没有雨滴。该数据集由 1,119 对图像对组成,图像包括了各种背景和雨滴。在RainDrop数据集中,有train、test_a和test_b三个文件夹,train文件夹中包含861个图像对,test_a文件夹中包含58个图像对,test_b文件夹中包含249个图像对。
2024-12-10 21:40:16
777
原创 【图像去雨滴数据集】RainDrop数据集介绍
RainDrop数据集由包含完全相同的场景的图像对组成,其中一张图像有雨滴覆盖,而另一张没有雨滴。为了达到这种效果,摄影师需要透过两片完全相同的玻璃进行拍摄,其中一块玻璃喷了水,而另一块玻璃则保持干净(相机为索尼 A6000 和佳能 EOS 60)。该数据集由 1,119 对图像对组成,图像包括了各种背景和雨滴。在RainDrop数据集中,有train、test_a和test_b三个文件夹,train文件夹中包含861个图像对,test_a文件夹中包含58个图像对,test_b文件夹中包含249个图像对。
2024-12-10 17:18:44
808
原创 深度学习中的数学基础【学习笔记】——第四章:线性代数基础
视频链接:高等数学、线性代数、微积分、概率论.…终于有人把深度学习的数学知识点讲透彻了! UP主讲解的非常好,受益匪浅,总结课程内容以供复习。目录1、行列式概述2、矩阵与数据的关系3、矩阵基本操作4、矩阵的几种变换5、矩阵的秩6、内积与正交
2024-12-08 09:59:52
435
原创 研究生第一篇文献综述怎么写,文献检索,文章整理,文献归纳高效方法小技巧【学习笔记】
UP主讲解的非常好,受益匪浅,总结课程内容以供复习。关于综述撰写的一些问题。
2024-12-06 08:54:10
1066
原创 如何下载arXiv网站中论文的原始图片【科研小技巧】
4、点击Source栏的Download source按钮,会下载一个名为arXiv-2308.10510v2.tar.gz的压缩包(不同论文压缩包名称不同)。3、检索到文章后,点击右侧的Other Formats。2、在右上角的搜索框输入要检索的文章标题并进行检索。5、解压压缩包即可获得论文中的原始图片。
2024-12-05 09:39:11
995
原创 图像修复算法常用评估指标介绍及Python代码(PSNR/SSIM/FID)
SSIM基于滑动窗口实现计算,即每次计算时从图片上取一个尺寸为N×N的窗口,基于窗口计算SSIM的值,遍历整张图像后再对所有窗口的值取平均,得出整张图像的SSIM值。FID是一种常用于评估图像生成模型和修复算法性能的指标,是目前广泛使用的评估指标之一。SSIM是另一个衡量图像质量的指标,它考虑了亮度、对比度和结构信息之间的相似性。最好的情况是FID=0,表示两个图像完全相同。PSNR值越高,表示修复图像与原始图像越接近。为修复图像和对应真实图像的均方误差。的特征向量之间距离的一种度量。
2024-12-04 09:31:05
1236
原创 如何借助ChatGPT高效生成PPT
案例:请帮我制作一个以“基于深度学习的图像去雾发展历程”为主题的PPT文档,需遵循以下规则:1、有封面和副标题2、有内容大纲3、至少10页4、以Markdown格式输出。
2024-11-26 20:04:52
1021
原创 【图像去雾数据集】NH-HAZE真实非均匀雾图像数据集介绍
NH-HAZE数据集是由蒂米什瓦拉理工大学、赫罗纳大学和瑞士苏黎世联邦理工大学计算机视觉实验室创建,是第一个包含非均匀雾霾场景的去雾数据集,包含55对真实的有雾霾和对应的无雾霾户外图像。雾霾图像是在使用专业雾霾机器产生的真实雾霾条件下拍摄的。本博客主要站在使用者角度简单介绍NH-HAZE数据集,想了解更详细的内容请看原始论文(文中还描述了很多采集图像的细节,如采用什么型号的雾霾产生机器、采用什么型号的相机拍摄照片等)!该机器能够高保真地模拟真实的雾霾条件。
2024-11-23 21:04:26
799
原创 【图像去雾数据集】Dense-Haze真实浓雾图像数据集介绍
Dense-Haze数据集是由蒂米什瓦拉理工大学、赫罗纳大学和瑞士苏黎世联邦理工大学计算机视觉实验室创建,包含33对真实的有雾霾和对应的无雾霾图像(下载的数据集中,有55对图像。雾霾图像是在使用专业雾霾机器产生的真实雾霾条件下拍摄的。本博客主要站在使用者角度简单介绍Dense-Haze数据集,想了解更详细的内容请看原始论文(文中还描述了很多采集图像的细节,如采用什么型号的雾霾产生机器、采用什么型号的相机拍摄照片等)!此外,由于图像是在受控环境中采集的,因此有雾和无雾图像都是在相同的照明条件下捕获的。
2024-11-23 20:09:29
1070
原创 【图像去雾数据集】O-Haze真实户外图像数据集介绍
O-HAZE数据集由西班牙巴塞罗那自治大学和德国慕尼黑工业大学联合发布,是第一个户外场景的数据集,包含45对有雾霾和对应的无雾霾图像,这些图像来源于45个不同的户外场景。其中,雾霾图像是在使用专业雾霾机器产生的真实雾霾条件下拍摄的。本博客主要站在使用者角度简单介绍O-HAZE数据集,想了解更详细的内容请看原始论文(文中还描述了很多采集图像的细节,如采用什么型号的雾霾产生机器、采用什么型号的相机拍摄照片等)!此外,由于图像是在受控环境中采集的,因此有雾和无雾图像都是在相同的照明条件下捕获的。
2024-11-23 09:10:36
1032
原创 【图像去雾数据集】I-Haze真实室内图像数据集介绍
2018年,CVPR下NTIRE(New Trends in Image Restoration and Enhancement)研讨会举办针对真实雾场景的目标检测挑战赛,I-HAZE数据集被选为挑战赛数据集。I-HAZE数据集对应论文:I-HAZE: a dehazing benchmark with real hazy and haze-free indoor images(ACIVS 2018)该机器能够高保真地模拟真实的雾霾条件。其中,雾霾图像是在使用专业雾霾机器产生的真实雾霾条件下拍摄的。
2024-11-22 22:07:22
953
原创 【预训练-微调】采用迁移学习的方式完成肺部感染识别-学习笔记
在本预训练-微调代码中,重点要学习的内容包括:加载官方提供的经典网络架构resnet50和对应的预训练模型,对ResNet最后的两层网络(池化层和全连接层)进行修改,改为适合自己任务的网络架构。对网络内容改动较大,值得学习和借鉴的地方很多。代码中主要改动了三个位置。第一步:加载预训练模型ResNet,该模型已在ImageNet上训练过。第二步:冻结预训练模型中低层卷积层的参数(权重)。第五步:微调超参数,根据需要解冻更多层。第三步:用可训练参数的多层替换分类层。第四步:在训练集上训练分类层。
2024-11-14 21:01:53
417
原创 【预训练-微调】迁移学习项目实战自定义数据集宝可梦精灵-学习笔记
在本预训练-微调代码中,重点要学习的内容包括:加载官方提供的经典网络架构resnet18和已经训练好的模型,对最后一层全连接层进行修改,改为适合自己任务的网络架构。在此基础上,训练最后一层全连接层,并保存最优模型。不同,本视频教程中提供了另一种分割经典网络架构与预训练模型的方法,在代码中主要改动了两个位置。
2024-11-14 10:23:11
575
原创 【预训练-微调】基于经典网络架构训练图像分类模型-学习笔记
在进行迁移学习的过程中,通常会采取两步训练的策略:首先对预训练模型中的某些特定层进行微调,然后再对整个模型进行进一步的训练,这样有助于提高模型在新任务上的表现。1、加载官方提供的经典网络架构和已经训练好的模型,对最后一层全连接层进行修改,改为适合自己任务的网络架构。在此基础上,训练最后一层全连接层,并保存最优模型。2、加载保存的最优模型,再利用数据集对整个模型全部进行训练,进一步提高模型的性能。的第30-41个视频。
2024-11-13 19:22:33
446
原创 PyTorch深度学习快速入门教程【小土堆】详细学习笔记(第23-33个视频笔记)
在完整的模型代码中,使用了tudui.train()和tudui.eval()这两行代码,train()和eval()并不是对所有代码都有用的,主要是对Dropout,BatchNorm等有用。第27、28和29个视频主要讲解了一个完整的模型训练和测试的过程,讲解的非常详细,视频值得反复观看、代码值得反复阅读和背诵。本节使用VGG模型讲解如何加载PyTorch官网中现有的神经网络模型,并修改加载后神经网络模型中的某一层参数(找不到VGG模型可以打开这个网址:)。以下代码是对上述课件内容的实现。
2024-11-12 21:33:22
902
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人