- 博客(66)
- 收藏
- 关注
原创 Noise Conditional Score Networks 简单总结
Score∇xlogpx1Score 是论文中的一个定义,表示概率密度px的梯度,沿着概率密度的梯度向前走,会走到概率密度最高的点。
2024-08-23 13:41:33
873
原创 DENOISING DIFFUSION IMPLICIT MODELS(DDIM 去噪扩散隐式模型公式推导)
推导Pxt−1∣xtx0Pxt∣x0Pxt∣xt−1x0⋅Pxt−1∣x01其中Pxt∣xt−1x0由于不服从马尔可夫性质,不能像DDPM一样化简为Pxt∣xt−1现在假设Pxt∣xt−1x0∼。
2024-08-22 17:14:55
1187
原创 Denoising Diffusion Probabilistic Models(DDPM)公式推导
前向过程的目标是通过原始图片得到添加了噪声的图片。x0表示原始图片 ,xt表示添加了噪声的图片,ϵt∼N01ϵ∼N01xtαtxt−1βtϵt1xt−1αt−1xt−2βt−1ϵt−12合并公式(1), (2)得到xtαtαt−1xt−2αt1−αt−1ϵt−。
2024-08-16 20:43:59
843
原创 MMCV,scoreSDE,rectifiedFlow代码
MMCV,scoreSDE,rectifiedFlow代码的思想都是将各种对象,包括函数 和模型,都都写到一个字典里面,用的时候用关键字调用。
2023-12-20 16:08:29
90
原创 VTM代码阅读 struct Size
struct Size{ SizeType width; SizeType height; Size() : width(0), height(0) { } Size(const SizeType _width, const SizeType _height) : width(_width), height(_height) { } bool operator!=(con
2021-07-22 16:07:00
308
原创 VTM代码阅读 struct Position
typedef int PosType;typedef uint32_t SizeType;struct Position{ PosType x; PosType y; Position() : x(0), y(0) { } //构造函数 Position(const PosType _x, const PosType _y) : x(_x), y(_y) { } //构造函数 bool operato
2021-07-22 16:01:35
196
原创 读论文A progressive CNN in-loop filtering approach for inter frame coding
abstractCNN环路滤波器用来增强视频质量。CNN模型通过学习原始帧与重建帧之间的关系来训练,训练好的CNN模型用在单个重建帧上增强视频质量。这种直接模型训练方法对帧内模式来说是有效的。但是由于没有考虑在帧间编码当中参考帧的相互依赖关系,这种直接训练的方法会造成过度滤波。为了解决这个问题,现有的方法通过RDO方法来选择性的使用CNN模型,但是这种方法没有解决CNN模型的单帧增强时局部优化的限制。这个文章提出了一个渐进式的方法去训练和嵌入CNN 环路滤波器到视频编码中。第一,文章开发了一个渐进式的训练
2021-06-20 15:54:03
221
原创 读论文 Early Exit or Not: Resource-Efficient Blind Quality Enha
Abstract有损图像压缩普遍被用来节约传输带宽,这导致了不好的压缩伪影。最近,大量的方法被提出来去减少编码端的压缩伪影,但是这些方法需要训练多个相同结构的模型来处理不同质量的视频,这不高效也很浪费资源。此外,在实践中,大家都知道如果不知道压缩图像的质量,那么很难选择一个合适的模型去处理。在这篇文章里,我们提出高效的未知压缩质量的图像增强方法RBQE。具体来说,我们的方法通过一个动态深度神经网络来盲目地渐进地处理压缩图像,方法中嵌入了提前退出机制(early-exit)。然后我们的方法可以根据增强图像的
2021-05-31 11:59:06
855
原创 论文阅读笔记 Improving Robustness of DNNs against Common Corruptions via Gaussian Adversarial Training
摘要深度神经网络在图像分类上表现的很好,但是测试数据稍有不同的时候,分类会有很大的下降。为了解决这个问题,通过高斯对抗训练,文章提出了鞍点方法来提高模型的健壮性。通过对抗的样本来训练,这些对抗样本的扰动呈高斯分布pass...
2020-12-24 16:21:41
319
2
原创 论文阅读笔记 Improving Compression Artifact Reduction via End-to-End Learning of Side Information
摘要通过传边信息来提高神经网络的滤波能力。在编码端分析原始图像与已经压缩的图像,得到边信息。在解码端,边信息用来增强滤波的效果。为了降低码量,整个模型在率失真控制下端到端学习简介PASS方法详述A 整体方案如图1所示,编码器把原始图像压缩成比特流,解码器再重建。通过一个神经网络来产生一个伪影描述子,这个描述子通过量化,熵编码传到解码端。在训练的时候,需要同时考虑边信息量与重建质量,这个用RDO来实现B 伪影描述的提取如图2所示 2 下箭头 表示步长为2的卷积,下采样的一种吧。把原始图像与
2020-12-23 14:54:19
236
原创 论文阅读笔记 Deep Convolutional Neural Network Based on Multi-Scale Feature Extraction for Image Denoising
摘要考虑到多尺度会损失细节信息,文章提出菱形去噪网络,通过一个固定尺度的网络和多尺度网络的融合,改善细节损失的问题。简介,动机分析记录:On one hand, the structure of encoding and decoding can effectively enlarge the receptive field which helps to improve network accuracy by considering more spatial context. But too muc
2020-12-22 12:04:34
667
原创 论文阅读笔记 UGNet: Underexposed Images Enhancement Network based on Global Illumination Estimation
摘要文章提出了一个新的神经网络对曝光不足的图片增强。与基于Retinex算法的分解方法不同,文章引入平滑扩张卷积去估计输入图像的全局亮度。提出联合内容,颜色,纹理,和平滑度的联合损失函数。背景介绍pass方法详述UGNet 可以分为两个部分,全局亮度估计网络,和细节增强网络。文章还详细说了多项损失函数的细节。A 全局亮度估计网络当前的一些增强网络通常会通过pooling,下采样或者多尺度连接来得到大范围的上下文信息和全局亮度信息。但是,一方面,对于密集的预测任务,多尺度上下文信息的收集需要扩大
2020-12-20 13:15:44
422
1
原创 论文阅读笔记 Sparse Representation-Based Intra Prediction for Lossless/Near Lossless Video Coding
摘要基于稀疏表征的帧内预测SRIP。在HEVC中有35种角度预测模式AIP,用最相似的相邻像素去表示当前待编码像素。为了编码与解码的一致,角度预测模式的参数要传到解码端,为了进一步提高编码效率,再传一个参数来表示是使用传统的AIP还是文章提出的方法SRIP。节约了0.36% 的码流。动机如图一所示,HEVC中有35种帧内预测模式,planar模式是为了产生渐变的内容,DC模式是相邻重建像素的均值,其他的是32中角度模式。实际上,planar模式可以看成一种联合模式,由mode10和26联合生成。如图
2020-12-19 16:48:25
358
原创 论文阅读笔记 A Unified Single Image De-raining Model via Region Adaptive Coupled Network
摘要由于雨水的的多样性以及不均匀的分布,单图像去雨是具有挑战性的。通过专用的模型和一些约束条件,现存的一些模型在一些特定的的雨类型上表现的很好。但是这些模型的生成能力也受到限制。在这篇文章中,通过有选择性地融合输入图像中没有雨的背景和已经恢复的有雨的区域。区域自适应结合网络(RACN),这个网络包括两个分支,这两个分支的特征相互结合。两个分支分别产生空间上可变的权重和已恢复的图像。在一方面,加权分支可以引导恢复分支更关注需要去雨的区域。另一方面,恢复分支可以引导权重分支远离没有雨的区域,避免过度滤波。实验
2020-12-16 19:57:39
146
原创 HM16.9 提取CU depth,cu partition可视化
以下内容参考:https://github.com/pengrenlai/HEVC-CUpartition-visualization提取CU depth,cu partition可视化(hm16.9)1,在TEncGOP.cpp 中的m_pcLoopFilter->loopFilterPic( pcPic );下面添加代码提取cu depth。遍历当前编码帧所有的CTU,再遍历CTU中每个4x4的depth block,按照Raster scan order 输出到文件中。 m_pcLo
2020-11-10 16:02:04
1373
5
原创 论文阅读笔记 - Dual Attention Network for Scene Segmentation
论文阅读笔记 - Dual Attention Network for Scene Segmentationabstrct一、pandas是什么?二、使用步骤1.引入库2.读入数据总结abstrct提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据
2020-09-25 15:53:22
347
原创 论文阅读笔记 - Residual Attention Network
论文阅读笔记 - Residual Attention Network for Image Classification摘要简介二、使用步骤1.引入库2.读入数据总结摘要文章中提出了残差注意力网络,将注意力机制结合到残差网络当中。残差注意力网络通过堆叠注意力模块来组成,这些注意力模块可以产生注意力敏感的特征。来自不同模块的具有注意力敏感的特征可以自适应地改变。在每一个attention模型内部使用了自上而下和至下而上的前馈结构,将前馈和反馈注意力机制展开到单一的前馈处理当中。文章提出用残差注意力学习的方
2020-09-20 20:25:41
593
原创 论文阅读笔记 - CBAM: Convolutional Block Attention Module
论文阅读笔记 - CBAM: Convolutional Block Attention Module摘要简介研究现状网络设计attention 机制Residual Attention NetworkSqueeze-and-ExcitationCBAMchannel attention modulespatial attention module使用方法代码实现附论文原文 https://arxiv.org/abs/1807.06521摘要文章提出卷积块注意力模块,对于前馈神经网络来说,这是一个简
2020-09-17 15:55:29
2622
原创 VVC算法描述阅读笔记
Notes for Algorithm description for Versatile Video Coding and Test Model 5##3.1 VVC coding architecture##3.2 Partitioninga CTU consists of an N×N block of luma samples together with two corresponding blocks of chroma samplesThe maximum allowed size o
2020-06-02 22:05:32
508
原创 learned video compression 论文理解翻译(2)
ML-based video compression.To our knowledge, theonly pre-existing end-to-end ML-based video compressionapproachs are [52, 8, 16]. [52] first encodes key frames, andproceeds to hierarchically inter...
2020-03-01 13:32:27
424
原创 四种常见机器学习方法
监督学习、无监督学习、半监督学习、强化学习是我们日常接触到的常见的四个机器学习方法:监督学习:通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出。无监督学习:它与监督学习的不同之处,在于我们事先没有任何训练样本,而需要直接对数据进行建模。半监督学习 :在训练阶段结...
2020-02-27 21:29:07
2108
原创 learned video compression 论文理解翻译(1)
Learned Video Compression基于机器学习的视频压缩Abstract摘要
2020-02-26 13:51:22
1601
原创 VTM7.0中的类的关系
https://blog.youkuaiyun.com/gq0323/article/details/103713402其中实心菱形表示组合关系,如菱形端表示公司,另一端表示公司的部门。空心三角形表示泛化,如三角形一端表示人,另一端表示具体的人如蔡徐坤...
2020-02-09 21:06:10
356
原创 训练图片生成,图片增强
from keras.preprocessing.image import ImageDataGeneratorfrom keras.preprocessing import imageimg_genarator = ImageDataGenerator(rotation_range = 50, width_shift_ra...
2019-12-26 12:12:06
250
原创 一个简单的网络,训练较慢
import numpyimport scipy.specialclass NeuralNetWork: def __init__(self,inputnodes,hiddennodes,outputnodes,learningRate): self.input_nodes = inputnodes self.hidde_nodes = hiddenn...
2019-12-24 09:12:40
239
原创 leetcode
bool backspaceCompare(string S, string T) { stack<char> temp1; stack<char> temp2; for(auto x:S) { if(x!='#') temp1.push(x); //在栈顶加入一个元素x ...
2019-12-18 18:25:40
91
原创 插入排序
#include <iostream>using namespace std;void InsertSort(int arr[],int n){ for(int i=0;i<n;i++) { for(int j=i;j>0;j--) { if(arr[j]<arr[j-...
2019-12-10 16:06:53
96
原创 归并排序
#include<stdio.h>void merge(int arr[],int L,int M,int R){ int left_size=M-L; int right_size=R-M+1; int left_arr[left_size]; int right_arr[right_size]; int i,j,k; ...
2019-12-10 10:39:10
113
原创 堆排序
#include<iostream>#include <stdio.h>using namespace std;void heapify(int tree[],int n,int i){ if(i>=n) { return ; } int c1=2*i+1; int c2=2*i+2; in...
2019-12-09 20:11:33
96
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人