我的毕设课题主要做的是快照压缩感知中的深度学习网络算法研究,考虑到对图像恢复的知识点欠缺固先从代码入手看其具体结构,大致如下 :
然后对论文中不熟悉的缩写进行一次比较全的汇总:
1.SCI(Snapshot compressive imaging) 快照压缩成像
2.HD or UHD 高清和超高清
HD 是指水平分辨率达到或超过720p(1280×720像素)的视频格式。最常见的高清标准是1080p(1920×1080像素),也称为全高清(Full HD)。
UHD 是指分辨率高于高清的视频格式,通常指的是4K分辨率(3840×2160像素),也称为4K UHD。UHD 提供的像素数量是1080p的四倍。
FHD(Full High Definition),意为全高清。这是一种视频显示格式,其分辨率为1920×1080像素。在FHD分辨率下,屏幕可以展示超过200万个像素点,这提供了比标准高清(HD)更清晰、更细腻的图像。
3.PnP(Plug-and-Play)即插即用的
4.ADMM(Alternating Direction Method of Multipliers),即交替方向乘子法,是一种用于求解优化问题的算法,特别是在处理大规模、分布式和平行计算问题时非常有效。ADMM通过将复杂问题分解为更简单的子问题来求解,这些子问题可以并行处理,从而提高计算效率。
5.GAP(Generalized Alternating Projection,广义交替投影)算法是一种解决优化问题的迭代方法,它特别适用于处理包含多个约束条件的优化问题。GAP算法的核心思想是将一个复杂的优化问题分解为一系列更简单的子问题,然后交替地解决这些子问题,直到找到原问题的解。
6.CACTI(Coded Aperture Compressive Temporal Imaging,编码孔径压缩时序成像)是一种结合了压缩感知(Compressive Sensing)原理和编码孔径技术的成像方法。它主要用于视频成像领域,能够在保持高时空分辨率的同时,减少所需的数据量,从而提高成像效率。CACTI技术特别适用于需要快速采集和处理大量图像数据的应用场景,例如高速动态场景的监控、运动分析和实时视频流的处理。
7.CASSI(Coded Aperture Snapshot Spectral Imaging,编码孔径快照光谱成像)是一种先进的成像技术,它结合了压缩感知(Compressive Sensing)和光谱成像技术,用于在单次快照中捕获场景的高光谱信息。这种技术特别适用于需要快速获取大量光谱数据的应用,如遥感、环境监测、医学成像和食品安全检测等。
8.TwIST(Two-Step Iterative Shrinkage/Thresholding)算法是一种用于图像恢复的优化方法,特别是在解决图像去噪、去模糊和压缩感知问题时。TwIST算法基于迭代收缩/阈值(Iterative Shrinkage/Thresholding)技术,它结合了两个步骤:梯度下降步骤和稀疏性促进步骤,以优化目标函数。
9.GMM(Gaussian Mixture Model)是高斯混合模型,它是一种概率模型,用于表示具有多个子群体的数据集,其中每个子群体的数据分布可以用高斯分布(正态分布)来描述。GMM是一种软聚类方法,与K-means这类硬聚类方法相比,它允许数据点属于多个聚类中心。
10.降噪器(BM3D、VBM4D、WNNM、FFDNet、)
BM3D(Block-Matching and 3D Filtering)是一种图像去噪算法,由Dabov等人在2007年提出。它是一种基于块匹配和三维变换域滤波的非局部均值去噪方法,被广泛认为是图像去噪领域中最有效和最流行的算法之一。
VBM4D( Variational Bayesian Method for 4D Data)是一种处理四维数据的变分贝叶斯方法。这种方法主要用于处理具有时间和空间维度的数据,例如视频序列或动态医学成像数据(如4D CT扫描,这里的第四维是时间)。VBM4D通过结合变分贝叶斯推断和多维数据处理技术,旨在从噪声数据中恢复出潜在的信号,并估计模型参数。
WNNM(Weighted Nuclear Norm Minimization,加权核范数最小化)是一种图像去噪算法,它结合了低秩和稀疏性的概念,用于从噪声图像中恢复出干净图像。WNNM算法通过最小化一个加权的核范数(即矩阵的奇异值)来促进图像的低秩性质,同时保持图像的重要结构特征。
FFDNet(Fast and Flexible Denoising Convolutional Neural Network)是一种基于深度学习的图像去噪网络,由Kai Zhang、Wangmeng Zuo和Lei Zhang提出。FFDNet旨在提供一个快速且灵活的解决方案,用于去除图像中的噪声,特别是在不同的噪声水平和不同类型的噪声下。
TV(TV Denoising)指的是总变分,这是一种衡量图像梯度变化的度量。总变分去噪是一种流行的图像去噪技术,它通过最小化图像的总变分来平滑图像,同时尽量保持图像的边缘信息。
差不多就这些考虑到这些在b站上搜完全没有感觉还得再琢磨琢磨。目前代码已经调通大致准备再其基础做一些老师的指导或者再看看相关的论文看看有没有更好的解决方法。
找到的相关参考文献是
1.Generalized Alternating Projection Based Total Variation Minimization for Compressive Sensing[J]. 2015. arXiv:1511.03890.
计软毕设的话目前是对神经网络的反向逆传播算法再推了一遍。
明天计划是完成计软和数院毕设的核心论文的翻译对文章理解加深一层。