自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 SAM 赋能扩散超分!SAM-DiffSR:无额外成本的结构级图像增强方案

SAM-DiffSR 的核心贡献的是提出了 “训练阶段注入结构信息,推理阶段免依赖” 的范式,完美解决了传统扩散超分的 “区域混淆” 难题。通过结构调制噪声机制和 SPE 模块,让模型学会区分语义区域,在不增加推理成本的前提下,实现了结构恢复与伪影抑制的双重提升。其开源代码已公开,无论是学术研究还是工业应用,都具有极高的参考价值 —— 既证明了 SAM 等通用分割模型对低层次视觉任务的增益,也为 “无额外成本引入结构信息” 提供了可复用的思路。

2026-01-09 21:30:00 571

原创 从实验室到真实场景!Real-ESRGAN 论文解读:让 AI 超分真正落地实用

Real-ESRGAN 的成功,在于它没有盲目追求复杂的网络架构,而是精准抓住了 “真实退化模拟” 这一核心痛点,用 “高阶退化 + 细节补充 + 模型优化” 的组合拳,让纯合成数据训练的模型具备了媲美真实数据训练的泛化能力。它不仅解决了 ESRGAN 在真实场景中的短板,更奠定了 “真实场景盲超分” 的技术范式,至今仍是超分领域落地应用的首选模型。

2026-01-08 22:30:00 415

原创 ESRGAN 论文解读:从 SRGAN 到照片级真实感的进化之路

ESRGAN 之所以能成为经典,在于它没有盲目追求复杂架构,而是精准定位了 SRGAN 的核心痛点,通过 “架构 + 损失 + 技巧” 的三重革新,实现了超分画质的飞跃。它不仅证明了 GAN 在超分任务中的潜力,更提供了一套 “实用、稳定、可落地” 的解决方案,至今仍对超分领域的研究和工业应用产生深远影响。如果你是超分领域的开发者或研究者,ESRGAN 的代码和论文细节值得反复研读 —— 它的设计思路不仅适用于超分,也能迁移到图像修复、去模糊等其他低层次视觉任务中。

2026-01-08 20:15:00 668

原创 超分辨率算法SRGAN论文阅读

用更深更快的卷积神经网络做图像超分,放大倍数一高,精细纹理就成了 “失踪人口”?早期损失函数都在死磕均方误差,结果就是图像峰值信噪比看着漂亮,实则高频细节缺失,画面像被磨皮过度,完全没有高分辨率该有的真实质感。别担心,SRGAN 带着对抗生成网络(GAN)来了!本文创新性地提出了对抗损失与内容损失,用感知相似性替代像素级比对,再搭配深度残差网络,就算是严重下采样的模糊图像,也能精准还原出逼真细腻的纹理细节,彻底解决超分 “好看不好用” 的痛点!

2026-01-04 21:45:00 853

原创 Jupyter Notebook保姆级安装教程

upyter Notebook 是一款开源的交互式编程环境,最初源于 IPython Notebook,名字取自它原生支持的三种核心语言:Julia + Python + R(Ju-Py-Te-R),现在已支持上百种编程语言,Jupyter Notebook 是交互式、混排式的编程环境,核心优势是 “代码分段运行 + 结果实时展示 + 文档混排”。

2026-01-04 20:15:00 178

原创 python3.12.7版本安装教程

Python 是一门诞生于 1991 年的解释型、面向对象、动态类型通用编程语言,以「简洁易读、生态丰富、跨平台兼容」为核心特质,历经三十余年发展,已成为全球最主流的编程语言之一,广泛覆盖数据分析、人工智能、Web 开发、自动化运维、科学计算等几乎所有技术领域。

2025-12-30 22:15:00 625

原创 第一章:图像基础知识

OpenCV于1999年由Intel建立开源发行的跨平台计算机视觉库操作系统:Linux、Windows、Android、Mac OS构成:C 函数和少量 C++ 类接口:Python、Java、MATLAB等语言opencv是数字图像处理和计算机视觉领域最常见的工具包,是学习,科研,企业项目开发的好帮手。

2025-12-29 17:31:16 724

原创 超分辨率算法SRCNN-Pytorch训练自己数据集+推理测试(详细图文)

对于想要入门超分技术的新手来说,SRCNN 更是绝佳的 “敲门砖”—— 它的设计思路清晰易懂,代码实现难度不高,吃透它之后,再去学习对抗网络、扩散模型等进阶算法,就能轻松上手,快速打通超分技术的任督二脉。这些方法就像 “照猫画虎”,只能勉强还原图像的大致轮廓,面对复杂场景时更是力不从心,根本无法满足实际应用的高清需求。而打破这一困境的,正是被称为超分领域 “开山鼻祖” 的 SRCNN,更让人惊喜的是,这篇经典论文的作者中,就有 AI 领域的大佬何凯明老师 —— 果然,大佬的眼光永远走在技术前沿!

2025-12-29 15:15:29 1152

原创 超分辨率算法SRCNN论文阅读

作者提出了一种用于单幅图像超分辨率(SR)的深度学习方法,使用SRCNN网络直接学习低分辨率图像和高分辨率图像之间的端到端映射关系。将低分辨率图像作为输入,并输出高分辨率图像。传统的基于稀疏编码的超分辨率方法也可以被视为一个深度卷积网络,但与传统方法不同,后者是分别处理每个组件的,而作者的方法则联合优化所有层。SRCNN深度卷积网络结构轻便,但展示了当时最先进的恢复质量,并且在实际的在线使用中实现了快速速度。此外,作者探索了不同的网络结构和参数设置,以在性能和速度之间取得平衡。

2025-12-24 10:53:40 900

原创 周志华《Machine Learning》学习笔记--第一章--绪论

周志华《Machine learning》第一章-绪论

2025-12-23 11:20:46 350

原创 目标检测算法YOLO V1论文阅读

YOLO提出了一种新的单阶段检测算法,前人的工作都是通过分类器进行目标检测。相反,YOLO将目标检测框架视为空间分离的边界框和相关的类概率的回归问题。YOLO 架构计算速度非常快,基本的YOLO模型在Titan X GPU上以每秒45帧的速度实时处理图像。该网络的一个较小版本Fast YOLO,处理速度达到惊人的155帧/秒,同时实现了其他实时检测器的mAP的两倍。与最先进的检测系统相比,YOLO有更多的定位误差,但对于背景的假阳性预测,可以减少误识别。最后,YOLO可以学习物体的一般表示。

2023-03-30 17:59:53 299 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除