自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

录求学之迹,留影于凡庸之日,若有益于君,更胜琼瑶。

【学习记录】:图像复原论文及复现;【工具类】:音视频相关处理

  • 博客(62)
  • 问答 (2)
  • 收藏
  • 关注

原创 【博客目录】:图像复原 | GIS | 力扣 | 论文 | 工具 | 学习

本文致力于打造「博客快速转跳」,聚焦图像复原、GIS、力扣、工具、学习等板块。通过「理论解读+代码复现+工具教程+资源地图」四维内容体系,帮助叶子们构建「知识-实践-工具」闭环,解决「论文看不懂」「代码跑不通」「工具用不溜」三大痛点。完善博客完善资源完善仓库本文将不定时更新以保证内容的时效性。

2025-03-23 16:03:26 1000

原创 【实用技巧】电脑重装后的Office下载和设置

在数字化办公时代,Windows和Office可以说最基本生产力工具。但对于重装系统的电脑来说,office都需要自行下载并进行对应的设置以获得良好的办公体验。因此,如何快速的进行下载何设置是一个具体的问题。本文主要简单阐述了如何快速下载Office和进行必要设置的方法以提高办公效率。

2025-04-02 14:26:10 495 1

原创 【复活吧,我的爱机!】Ideapad300-15isk拆机升级:加内存条 + 换固态硬盘 + 换电源

复活吧,我的爱机!本文详细的介绍了 Ideapad300-15isk 拆机升级的过程,包括加内存条 、换固态硬盘、换电源等,有效的提高老旧电脑的流畅度。

2025-03-30 22:00:08 1140

原创 【实用技巧】Bilibili大学超两倍速设置

在职场高强度节奏下,时间成为最稀缺资源。对于已掌握基础知识的职场人,2倍速以上播放如同「认知快车道」。如备考、理论复述、背景介绍等场景中,高倍速形成效率复利效应,使单位时间内的知识转化价值呈指数级增长。Bilibili大学,各位叶子应该都不陌生,目前提供0.5倍至2倍速调节范围,对于具有一定基础的小伙伴,无论是理论课程、技能教学还是知识科普类内容,都希望超2倍速进行快速学习和复盘,尤其是某些视频的语速是真的拖拉。因此如何突破2倍速,是一个非常现实的问题。

2025-03-28 20:34:12 489

原创 【UTM】通用横轴墨卡托投影

通用横轴墨卡托投影(UTM)是地图投影领域的重要创新,其诞生源于对高精度地理坐标表达的迫切需求。20世纪中叶,随着军事导航、资源勘探和工程测量的精度要求提升,传统投影方式在区域变形控制上的局限性日益凸显。UTM通过横轴墨卡托投影原理与分带技术的结合,巧妙地将地球划分为60个经度带(每个带宽6度),以中央经线为基准构建局部坐标系,既保留墨卡托投影保形特性,又通过分带控制变形范围,使各带内距离、角度和面积精度达到实用平衡。

2025-03-26 21:26:49 771

原创 【Spark-TTS】从此你的声音是我的了

本文主要讲解了从克隆Spark-TTS库到进行声音克隆的过程,包括安装依赖、下载权重、UI界面及问题解决等。

2025-03-22 20:23:27 942

原创 【WGS-84坐标系】我去石圪节公社找胡得禄给我弄了个时兴的球头

WGS-84坐标系作为全球地理空间技术的核心基准,定义了地球质心为原点的三维定位标准,通过经度、纬度和高程实现米级至厘米级精度。其技术优势在于全球统一性和动态更新机制,消除地域偏差,适应地球物理变化,支持GPS、北斗等多系统兼容。该坐标系广泛应用于导航、测绘、遥感和GIS领域,是数字地图、车辆定位、航空航天的基础框架。日常生活中,手机导航、无人机飞行均依赖其基准,推动现代空间技术发展。其不可替代性在于整合全球数据,促进跨国合作,成为人类探索地球的关键工具。

2025-03-22 14:18:57 898

原创 【NeurIPS-2022】CodeFormer: 将人脸复原转化为码本预测以减少LQ-HQ映射的不确定性

盲人脸恢复是一个高度不适定的问题,通常需要辅助指导,各种先验已经被用来减轻这个问题的不适定性,包括几何先验,参考先验和生成先验。LQ-HQ映射不确定性仍然存在,并且输出质量因输入图像的退化而恶化。一些基于生成先验方法,通过迭代优化或直接潜在编码将退化的人脸投影到连续的无限空间中。在严重退化的情况下,很难找到准确的潜在向量,导致低保真度的结果。进而将盲人脸恢复作为代码预测任务可大大降低恢复映射的不确定性和模糊性,同时提供丰富的视觉原子来生成高质量的人脸。

2025-03-18 21:08:31 1038

原创 【CVPR-2023】DR2:解决盲人脸复原无法覆盖真实世界所有退化的问题

盲人脸复原通常将退化的低质量数据与预定义的退化模型进行训练,不足以囊括真实世界中的更复杂的退化场景;因此在复原真实退化时候经常观察到伪影。同时,构建训练集以覆盖真实世界的各种退化是不可能的。本文为了解决这个问题,提出了一种两阶段的复原方法即基于扩散的鲁棒退化去除器(DR2),先将退化图像转换为粗糙但退化不变的预测,然后使用增强模块将粗糙预测恢复为高质量图像,使得DR2对常见的退化具有鲁棒性(例如模糊,调整大小,噪音和压缩)和兼容不同的设计增强模块。

2025-03-16 20:40:40 856

原创 【异地访问本地DeepSeek】Flask+内网穿透,轻松实现本地DeepSeek的远程访问

为了方便本地化部署后,异地调用本地模型进行推理,可以按照以下步骤操作:1. 基础环境:在LM Studio官网下载并运行对应的GGUF模型,以及安装对应的python包。2. Flask构建网页:Flask结合LM Studio的端口和HTML构建网页,实现网页对话。3. 内网穿透:通过花生壳将Flask所开放的端口进行映射,实现异地访问本地的模型。

2025-03-01 00:08:33 1394

原创 【论文学习】RVS-FDSC:一种基于四方向条带卷积的视网膜血管分割方法以增强特征提取

RVS-FDSC在保留传统U-Net优势的同时,通过残差条纹卷积模块(RSC)、多尺度特征融合技术(MSPF2)和残差并行双注意力(RPDA)模块显著提升了对视网膜血管特征的捕捉能力。实验结果表明,与传统方法相比,所提出的方法在分割精度上具有显著提升。未来可以进一步研究其在其他医学图像分割任务中的应用。

2025-02-19 23:22:54 1166

原创 【DeepSeek本地化部署保姆级教程 】20分钟带你轻松配置与高效运行

为了方便本地化部署并高效进行大模型推理任务,可以按照以下步骤操作:下载和安装:在LM Studio官网下载对应的版本,并选择安装位置或自定义安装点。配置与设置:点击右上角跳过菜单,进入右下角的“设置”,设置语言为中文。并在线搜索目标模型。模型加载与管理:通过搜索结果点击模型即可加载到当前工作目录中,确保模型文件已正确下载并保存。项目配置:在空间富余盘创建存储模型的文件夹,如 deepseek_model。将训练好的模型文件复制到该文件夹下,并设置为当前工作目录。推理与验证:在对话框中输入问题即可。

2025-02-19 14:37:58 1331

原创 【论文学习】Bridge-Net:结合上下文信息与图像块损失权重映射的视网膜血管分割方法

视网膜血管分割对眼科疾病早期诊断至关重要,但面临血管形态复杂、类别不平衡及上下文信息缺失等挑战。Bridge-Net结合上下文信息和动态损失权重,通过两个U-Net网络生成判别特征,并使用循环神经网络传递上下文信息,生成视网膜血管的概率图。实验结果显示,Bridge-Net在多个数据集上均表现出高精度与鲁棒性。然而,关于其推理速度,尤其是在处理高分辨率图像时是否能达到实时要求,仍需进一步探讨。

2025-02-18 11:46:05 797

原创 【回首U-Net】:类U-Net网络结构中具潜力的创新与调整

U-Net作为一种经典的神经网络模型,在生物医学图像分割领域取得了卓越成就。其对称的编码器-解码器结构、卓越的性能优势以及广泛的实际应用,使得U-Net成为深度学习技术在图像分割领域的重要里程碑。但在实际的类U-Net网络中是否一成不变的沿用其结构,这值得思索,诸如通道数量的调整和特征融合的方式等,往往需要不断的尝试和实验。

2025-02-17 20:44:09 686

原创 张量循环运算:内存溢出原因及解决

使用AlexNet遍历大量图像进行指标运算(LPIPS),内存溢出。tensor.item()减少内存溢出。

2025-02-14 17:19:00 189

原创 【TS合成MP4】你怎么专打裂开的切片呀

在现代视频处理中,TS(Transport Stream)和MP4是两种常见的视频封装格式。TS格式通常用于实时传输的视频流,如通过HLS(HTTP Live Streaming)协议进行直播或点播的视频内容,而MP4则以其广泛的兼容性和高效的数据压缩技术,在存储和分享视频内容方面占据主导地位。因此,将TS文件合成MP4格式成为了一个常见的需求,特别是在需要将流媒体视频内容保存或分享到多种设备上时。支持多节目复用和多种数据类型(如视频、音频、字幕等)的传输。

2025-02-14 16:06:20 1115

原创 创作三载·福启新章2025

在2022年01月26日,我踏上了技术创作的征途,以一篇《【Anaconda 的安装、简单使用及常见的错误解决】》为起点,记录下了我的初体验。转眼间,1095个日夜已悄然流逝,这段旅程见证了我的成长与蜕变。无论日常多么繁忙,创作之心始终炽热。愿我的故事能激励你,也愿你的创作之旅永远充满新鲜与激情。今天,借除夕和纪念里程的机会,祝叶子们在灵蛇献瑞的蛇年,愿科研探索的每一步都如蛇般灵动而精准,愿团队合作如蛇行般默契无间,愿事业有成,科研成果丰硕,生活美满幸福!2025,愿所忧所盼,皆念之行之。

2025-01-28 10:30:50 495

原创 【2024 - 年终总结】叶子增长,期待花开

2024,是特殊的一年,研究生生涯也成功画上了句号。从研途中成功下马,虽谈不是学有所成,但也算是顺顺利利毕业,顺顺利利的入职高校。回首2024,承蒙导师之谆谆教诲、同窗之热情帮助、挚友之坚定支持、亲人之温暖陪伴。在学术和生活之间也取得较好的平衡,开始有意识地尝试新事物,逐渐突破自我,实现完成从‘研究牲’到“牛马”的转变,不断挖掘潜力以更好地迎接生活的挑战。非常幸运,遇到了一群优秀的小伙伴,可以说相见恨晚,对我的生活产生巨大影响,相信持续下去能做最好的自己。2025,愿所忧所盼,皆念之行之。

2025-01-23 16:39:38 925 4

原创 【TPAMI-2024】EfficientTrain++帮你降低网络训练的成本

该出了一种新的广义课程学习方法EfficientTrain++,总是利用每个学习阶段的所有数据,但只在训练开始时暴露每个示例的“容易学习”模式(例如,在数据增强之前,图像和原始信息的低频成分),并随着学习的进展逐渐引入更困难的模式。为了设计一个合适的课程学习计划,提出了一个定制的计算约束的顺序搜索算法,产生一个简单的,良好的泛化,但惊人的有效的训练课程。

2024-06-04 14:53:00 1143

原创 【U-Net验证】逐元素乘积将特征投射到极高维隐式特征空间的能力

本文将U-Net解码中的特征拼接修改为逐元素求和和逐元素乘积,并针对血管分割任务进行了性能评估。实验结果显示,在无激活函数时,逐元素乘积在多个关键指标上均优于逐元素求和,性能提升幅度在0.2%至3%之间,表明逐元素乘积确实能在一定程度上提供更高维度的隐式空间。从分割结果来看,逐元素乘积似乎对较大的血管具有更好的分割效果,能够更准确地捕捉血管的轮廓和细节。同时,使用逐元素乘积的分割结果也表现出更高的光滑性和一致性,减少了噪声和伪影的干扰,从而提高了分割结果的可靠性和可读性。

2024-06-02 13:02:32 713

原创 【CVPR_2024】:逐元素乘积为什么会产生如此令人满意的结果?

该论文则是通过明确地证明星型运算具有将输入映射到一个非常高维的非线性特征空间的能力,来解释星型运算的强代表性能力。- 揭示了星形运算具有将特征投射到极高维隐式特征空间的能力- 通过实证结果和理论探索来验证分析以及视觉表现- 提出StarNet,超越了许多高效的设计。- 该论文的分析可作为一个指导框架,引导研究人员进行的络设计。

2024-06-01 17:26:02 2016

原创 PSFRGAN量化:量化技术、实现步骤与常见问题解决

本文深入探讨了PyTorch框架下的模型量化技术,介绍了量化的一般流程,包括动态量化和训练后量化等,以PSFR-GAN为例,详细介绍了其训练后静态量化的步骤,包括模型加载、静态量化、模型定义、QuantStub和DeQuantStub的使用,以及运算改写等关键步骤。同时,文章也记录了在量化过程中遇到的一些问题和挑战。

2024-05-12 14:13:08 810

原创 PSFR-GAN复现

PSFR-GAN是一个基于深度学习的开源项目,其主要目标是实现高质量的人脸图像盲复原。PSFR-GAN的核心是生成对抗网络,包括两个部分:生成器和判别器。生成器负责从低分辨率图像生成高分辨率图像,而判别器则试图区分真实高分辨率图像与生成器产生的图像。在训练过程中,这两个网络相互竞争并共同提升,直至生成器可以产出难以被判别器识破的高分辨率图像。PSFR-GAN在图像超分辨率重建方面有以下特点:结合了几何先验,能够生成具有清晰面部形状和逼真面部细节的图像。

2024-05-06 12:32:30 973

原创 PyCharm环境下Git与Gitee联动:本地与远程仓库操作实战及常见问题解决方案

本篇文章详细阐述了如何在PyCharm集成开发环境中整合Git与Gitee服务,以实现本地与远程仓库的有效管理和协作。首先介绍了Git的安装以及Git在PyCharm中的配置与基本使用,包括如何创建仓库、创建与切换分支、提交代码等操作。随后,针对可能遇到的常见问题,如无法创建分支、推送失败等,提供了参考解决步骤与策略。旨在帮助读者更好地利用PyCharm与Gitee的无缝衔接,提升开发效率与版本控制能力。

2024-03-25 16:49:36 6082 1

原创 内部控制提纲

在撰写论文时,可以根据实际情况调整论文提纲的结构和内容,确保论文的逻辑性和连贯性。同时,要注重理论与实践相结合,充分引用相关文献和案例,以提高论文的说服力和可信度。5.3 内部控制优化策略的实际应用效果。3.1 企业内部控制体系的建设情况。5.2 内部控制优化前后的对比分析。3.2 内部控制存在的问题与不足。1.1 内部控制的定义与重要性。1.2 内部控制的目标与原则。2.1 内部控制框架与模型。2.2 内部控制要素与关系。2.3 内部控制理论的发展。四、内部控制优化策略与建议。

2024-02-28 19:59:59 637

原创 远程连接服务器:Ping通但SSH连接失败的解决办法

远程连接VPN可能存在些问题,导致无法成功连接,因此在本文中,将详细介绍SSH连接远程失败的问题和解决步骤,通过这些信息,希望帮助小伙伴更好地解决VPN连接的问题,以便在必要时能够有效地进行居家学习/办公。

2024-01-31 15:15:50 18427

原创 电脑重装后恢复音频输出(安装声卡驱动)

在安装声卡驱动之前,首先需要了解主板型号和操作系统版本,以便下载正确的驱动程序。通常,您可以在对应官方网站上找到与主板和操作系统相匹配的声卡驱动程序。下载并解压缩声卡驱动程序。确保从官方网站下载正确的驱动程序版本,并将其解压缩到计算机上。安装声卡驱动程序。打开解压缩的声卡驱动程序文件夹,运行安装程序。按照屏幕上的指示进行操作,完成声卡驱动程序的安装。并配置音频输出。

2024-01-04 20:50:13 8036

原创 你的轻量化设计能有效提高模型的推理速度吗?

轻量化网络是指在保持较高性能的同时大大减少模型参数和计算量的神经网络模型。轻量化网络的出现是为了解决在移动设备和嵌入式系统等资源受限的环境中部署深度学习模型时所面临的挑战。传统的深度学习模型通常包含大量的参数和复杂的计算结构,这使得它们在移动设备上运行时需要消耗大量的内存和计算资源。而轻量化网络通过精心设计结构和参数,可以在移动端实现更加高效的部署,从而适应移动设备上的应用需求。因此轻量化网络的研究和发展是深度学习领域的一个重要方向,涉及网络结构设计、模型压缩、量化技术、剪枝等多个方面。

2023-12-07 15:08:27 1416

原创 正则化与正则剪枝

正则化是一种在机器学习中用于控制模型复杂度的技术,它通过在损失函数中添加一个额外项来对参数进行约束,从而避免过拟合。其中,L1正则化通过对参数的绝对值求和来实现,能够产生稀疏权重;L2正则化通过对参数的平方和求根号来实现,能够产生较为平滑的权重;实际上可以结合两者来共同约束参数。在实际应用中,正则化可以帮助模型更好地泛化数据,提高模型的鲁棒性和可靠性。同时,正则化也需要根据具体问题进行调整,不同的正则化方法和系数可能会产生不同的效果。

2023-11-26 21:58:01 1453

原创 MobileNets发展与总结

MobileNet是一种轻量级的深度卷积神经网络(CNN),旨在在计算资源有限的移动设备上实现高效的图像分类和目标检测。MobileNet的设计出发点是通过减少模型参数和计算量来提高模型的速度和效率,同时尽可能保持模型的准确性。MobileNet首先引入了深度可分离卷积(Depthwise Separable Convolution)结构。随后MobileNet后续由一系列的Inverted Residual Blocks组成。

2023-11-25 14:15:07 1101

原创 【手写快排与Sort】

- 快速排序适合所有情况?数据量少时,效率可能低于简单排序。 - 时间复杂度不是稳定的O(nlogn),最坏情况会退化为冒泡 - 递归层次过深会导致性能下降、栈溢出甚至程序崩溃

2023-10-31 10:20:26 369

原创 【阿里云试用计划】免费试用GPU

随着数据集越来越大,各种深度学习任务如图像、扩散模型、多模态、大模型等对算力的要求也稳步较高、为提高模型性能网络参数也逐步提升,以至于想要体验都不方便,更别提需要训练网络的学生。因此白嫖算力成为一种无奈之举,下面提供一种途径:阿里云试用计划,希望对小伙伴们有帮助。

2023-07-22 19:24:36 2104 2

原创 【宝藏网站】配色 | 素材 | 文生图 | 文生音 | 艺术字体

本文旨在分享一些常见、实用、干净的一些工具网站,希望可以在日常的学习和工作中帮助到叶子们,有兴趣的可以去尝试,不定时更新呢!叶子们如果有一些其他的网站推荐,也欢迎留言交流。

2023-07-21 14:32:34 212

原创 【论文学习】PromptIR:一种基于提示学习的一体化图像恢复方法

PromptIR:一种基于提示学习的方法来执行一体化图像恢复。具有以下的特点①完全依赖于输入图像来恢复干净的图像,而不需要任何退化的先验知识。②很容易地集成到任何现有的恢复网络。。③具有动态适应能力

2023-07-20 11:28:27 2583 11

原创 【视频的动态对比】

主要是实现视频修复后的视频动态对比,以及部分的人脸、关键点检测,video提取音频、视频添加声音、video转GIF等功能。

2023-07-19 21:28:59 450

原创 Markdown常见语法

一个有写博客的人,难免会遇到markdown语法不会,本博客主要记录一些常见但是不易记的内容以备查询。暂时包含的内容有:标题、字体、图片等常见的设置,如大小,颜色、排列等。

2023-07-18 16:59:14 107

原创 【论文学习】RAHC:一种处理五种常见天气的任意混合退化的图像修复方法

RAHC通过AdverseGAN学习隐式退化提供成对的训练数据,使用三种量身定制的设计结构,以一次性恢复任意混合恶劣天气条件(图1(d)),具有下列特点:①多天气退化表示的多头混合块(MHBB):覆盖卷积和注意混合算子的多头机制可以为混合多天气学习提供多个“表示子空间”以及互补特征。②用于图像成分保留有限的混合条件下的重建向量辅助恢复(RVA):在大规模自然图像上预训练的Codebook中封装的离散表示(重建向量),可以提供额外的视觉内容线索,以辅助重建真实而清晰的输出。③高效任意混合条件恢复

2023-07-18 14:56:30 1124 2

原创 Jupyter Notebook 后台启动

后台启动 jupyter notebook,或者服务器上启动 可通过浏览器访问。查找进程,适用于kernel 死亡,或者关闭jupyter notebook。注意:无法导入依赖包,查看是否激活对应环境。可以查看对应的进程,pid编号,用于停止。激活环境 conda activate。kill 进程 kill PID。如需重新启动,则参考步骤 1-3。再次查看,确认关闭该进程。

2023-07-17 16:56:09 1986 1

原创 【论文学习】DifFace:一个建立在后验分布上的鲁棒扩散模型

DifFace是这么一个通过建立低质量(LQ)图像到高质量(HQ)图像的后验分布,以生成具有清晰面部形状和逼真面部细节的图像,具有下列特点:①后验分布:从LQ图像开始到理想HQ图像结束的马尔可夫链。②在反向扩散过程中部分构建马尔可夫链以利用在预训练扩散模型中捕获的图像。③没有复杂损失,只需要训练一个具有L2损失的神经网络,简化了训练。

2023-07-16 14:07:53 728

原创 【论文学习】Panini-Net:一种可根据退化程度动态融合特征复原方法

Panini-Net通过无监督退化表示学习策略来提取退化图像的判别退化表示,并作为动态融合的全局条件,以生成具有清晰面部形状和逼真面部细节的图像,具有下列特点:①化感知特征插值(DAFI)模块。②无监督退化表示学习策略。③特征提取模块。

2023-07-15 21:47:17 478

DeepSeek 本地部署后构建网页实现对话

通过访问本地LM Studio部署的DeepSeek所提供端口,进而使用Flask进行网页构建以完成本地网页访问,结合内网穿透,可实现异地访问本地部署DeepSeek。

2025-03-19

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除