- 博客(78)
- 资源 (2)
- 收藏
- 关注
原创 ECM8.0——CCCM相关代码
在计算出参考区域信息后,函数将返回一个降采样后的luma buffer,该buffer是参考区域包括填充的2D滤波器所需的大小,并将指针指向参考区域左上角。在代码中,通过一系列的if语句和for循环,获取了采样所需的位置信息,并调用xCccmGetLumaVal函数,获取对应位置的luma值,并填充到refLuma中。对当前块需要参考的区域范围内的每个采样点进行逐一遍历,根据像素位置计算出其在参考帧中的位置,并从参考帧中获取相应的亮度值,写入到参考亮度缓冲区域中。
2023-04-13 15:44:35
1241
2
原创 VVC之编码结构
每个PU包含且仅包含一幅完整图像的编码数据。当一个AU包含多个PU时,每个PU可以是特定质量或分辨率(可分级视频流)图像,也可以是多视点视频的某一视点,以及深度、反射率等属性信息。因此,AU中的不同PU被归属为不同的层(Layer)。参数集是一个独立的数据单位,它包含视频不同层级编码单元的共用信息。VPS:PU间相互依赖关系,哪些PU解码图像可以输出之类的。主要用来支持分层编码。SPS:一个CVS中所有图像共用的信息,如档次级别,编码工具开关标志等。PPS:一幅图像所有Slice的共用信息。
2023-04-12 15:42:42
1077
原创 ECM8.0——代码整体初窥
看起来pos()和size()返回的都是 *this,但其实返回类型是不一样的,返回的this会变成对应的类,可以说是基类指针和子类指针的区别,也可以说是一种运行时多态的实现方式。
2023-04-04 17:22:56
721
原创 VVC之跨分量预测
且第一个参考像素点位置为16>>(2+1)=2,参考像素的间隔为16>>(1+1)=4,因此,选取的4个参考像素点的位置分别为:2,6,10,14。在H.266中,首先根据亮度Y的大小,将较大的2对参考点分成1组,较小的两对参考点分成1组,然后对每组参考点的亮度值和色度值求平均值,得到一对亮度和色度均值。下图是CCLM的预测过程示意图,对于YUV420的格式,亮度分量需要通过下采样和色度分量之间的空间分辨率保持一致,然后根据参考像素的亮度和色度计算线性模型参数,然后利用亮度重建值来计算色度预测值。
2023-04-03 15:57:33
839
转载 connect to github.com port 443: Timed out
源地址git config --global --unset http.proxygit config --global --unset https.proxy
2021-11-01 19:42:22
131
原创 安装完anaconda后输入conda没有反应
根据网上的教程成功安装了anaconda,anaconda安装。但出现了conda没有反应的情况,按照教程进入vim ~/.bashrc输入了export PATH=~/anaconda3/bin:$PATH也没有解决。 经过长时间查找资料,找到了一个对我来说有用的方法,如下:在终端输入source ~/.bashrc对bashrc进行更新。在终端输入export PATH=~/anaconda3/bin:$PATH将anaconda配置进环境变量。...
2021-09-20 17:39:45
5850
2
原创 尺度不变特征匹配 SIFT & 可变形卷积概念定义
可变形卷积 Deformable Convolution什么是SIFT1. 高斯模糊2. 尺度空间极值点检测2.1 尺度空间理论2.2 高斯金字塔的构建2.3 高斯差分金字塔什么是可变形卷积什么是SIFT Scale Invariant Feature Transform(SIFT) 尺度不变特征匹配算法。 尺度不变特征转换是一种电脑视觉的算法,用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量。SIFT特征是基于物体上的一些局部外观的兴趣点而与影像的大
2021-09-19 11:23:00
729
原创 Hung-Yi Lee homework[14]:Life Long Learning
Hung-Yi Lee homework[14]:Life Long Learning一、Life Long Learning原理二、作业描述一、Life Long Learning原理 Life Long Learning的意思是:机器首先学习了任务一,然后学习了任务二,此时机器同时掌握了任务一和任务二,如果机器在之后的时间中继续学习别的任务,机器就能够拥有更多的技能,理想状态下,机器可以无所不能。 要想实现Life Long Learning,需要解决以下几个问题:(1)如何在学习新知识时对
2021-08-30 23:13:53
306
原创 Hung-Yi Lee homework[12]: Transfer Learning (Domain Adversarial Training)
@[TOC](Hung-Yi Lee homework[12]: Transfer Learning (Domain Adversarial Training))一、Transfer Learning原理介绍 Transfer Learning:迁移学习。把为任务A开发的模型作为初始点,重新使用在为任务B开发模型的过程中。迁移学习和传统机器学习的区别:迁移学习传统机器学习数据分布训练和测试数据不需要同分布训练和测试数据同分布数据标签不需要足够的数据标注足够的数
2021-08-24 15:47:48
364
原创 Hung-Yi Lee homework[10]: Anomaly Detection
Hung-Yi Lee homework[12]: Transfer Learning
2021-08-23 23:19:20
359
原创 Hung-Yi Lee homework[9]: Unsupervised Learning
Hung-Yi Lee homework[9]: Unsupervised Learning
2021-08-10 15:42:24
291
原创 Hung-Yi Lee homework[8]: Sequece to Sequence
Hung-Yi Lee homework[8]: Sequece to Sequence
2021-08-03 12:15:15
777
1
原创 Hung-Yi Lee homework[7]: Network Compression
Hung-Yi Lee homework[7]: Network Compression一、知识蒸馏1.1 知识蒸馏的理论依据 李宏毅老师上课介绍了四种network compression的方式(知识蒸馏,网路剪枝,网络重构,参数量化)在此进行一个整理。一、知识蒸馏 主要思想:通过使用一个较大的已经训练好的网络去训练一个较小的网络,使得小网络可以尝试复制出大网络的输出。1.1 知识蒸馏的理论依据 知识蒸馏使用Teacher-Student模型。知识蒸馏的过程分为2个阶段:原始模型训练
2021-07-19 23:22:42
303
2
原创 Hung-Yi Lee homework[6]:Adversarial Attack
Hung-Yi Lee homework[6]:Adversarial Attack(一)作业描述(二)作业实现(一)作业描述 使用FGSM得到攻击图像。 算法地址(二)作业实现import osimport pandas as pdfrom PIL import Imageimport numpy as npimport torchimport torch.nn.functional as Fimport torchvision.datasets as datasetsfro
2021-06-22 14:56:10
242
原创 Hung-Yi Lee homework[5]:Explaninable ML
Hung-Yi Lee homework[5]:Explaninable ML(一) 作业描述(二) 实现过程1. Sailency Map(一) 作业描述 本次作业分为3个任务:(二) 实现过程1. Sailency Mapimport osimport sysimport argparseimport numpy as npfrom PIL import Imageimport matplotlib.pyplot as pltimport torchimport torch
2021-06-15 17:38:51
299
1
原创 Hung-Yi Lee homework[4]:RNN
Hung-Yi Lee homework[4]:RNN作业描述实现过程utils.pyword2vec.pydata_preprocess.pydataset.pymodel.pytrain.pytrain_main.pytest.pypredict.py作业描述 输入英文句子,输出0或1(如果句子是正面的,标1;如果句子是负面的,标0)。要求采用RNN。 下载的数据中包含三个文件:training_label.txt,training_nolabel.txt,testing_data.txt。
2021-06-01 17:11:03
426
1
原创 AVS3代码阅读HPM4.0
参考AVS3代码阅读(HPM6.0)(一.整体架构以及CU划分部分代码)版本:HPM4.0核心文件:app_encoder.c 要做的是帧间预测,所以前面的函数先暂时不管了,挖个坑以后再填。直接从enc_pic看起。enc_pic() ...
2020-12-13 18:33:56
2924
9
原创 《H.265/HEVC——视频编码新标准及其扩展》一:视频编码基础
视频编码基础1.2.1 图像的自相关系数1.2.2 像素差值的自相关函数1.3 混合编码1.3.3 运动估计和运动补偿 声明:在专业课学习上都已经接触过的内容,在本博客中不再赘述。1.2.1 图像的自相关系数 图像的相关函数:可以直接反映任意图像像素之间的关联程度,可以在统计平均的意义上来计算他们之间的相似程度。个人觉得(1.13)的公式出错了,公式分子上的两个求和符号应该是没有的,并且应该×N2\times N^2×N2【有读者给我评论一起探讨吗?】1.2.2 像素差值的自相关函数
2020-11-18 21:48:14
2069
7
原创 Hung-Yi Lee homework[2]:classification
Hung-Yi Lee homework[2]:classification一、作业要求二、开始实验2.1 Logistic regression2.1.1 加载数据:[addition]open()和with open() as的区别[addition]python3 File next()方法2.1.2 归一化[addition]python定义函数 返回值只取其中一个[addition]np.arange()[addition]np.mean()2.1.3 分割训练集-验证集2.1.4 开始训练[ad
2020-11-15 16:15:21
309
原创 Hung-Yi Lee homework[1]:regression
Hung-Yi Lee:regression1. 导入所需要的库2. 导入train数据pandas.DataFrame.ilocpandas.DataFrame.to_numpyNumpy数组ndarray的内部机理3. data数据的预处理reshape(1,-1)4. normalization5. 从训练集中取出一部分设立验证集6. 开始训练adagrad(Adaptive gradient alorithm)7. 对测试集进行预处理8. 验证模型并预测 鸣谢:李宏毅2020机器学习作业1——
2020-11-08 17:16:32
675
原创 从头开始opencv(十三)——image:Eroding and Dilating
从头开始opencv(十三)——image:Eroding and DilatingGoalMorphological OperationsDilation(膨胀)Erosion(腐蚀)CodeExplanationerosiondilationCreateTrackbar()参考资料Goal Apply two very common morphological operators: Erosion and Dilation. For this purpose, you will use the
2020-11-05 22:05:41
488
原创 从头开始opencv(十二)——image:Smoothing
从头开始opencv(十二)——image:SmoothingGoalTheoryNormalized Box FilterGaussian FilterMedian FilterBilateral FilterCodeExplanationBlur()GaussianBlur()MedianBlur()bilateralFilter()Goal In this tutorial you will learn how to apply diverse linear filters to smooth
2020-11-01 10:17:29
443
原创 opencv(十一)——core:file input and output
opencv(十一)——core:file input and outputGoalExplanationwhat is XML/YAMLmainXML/YAML File Open and CloseInput and Output of text and numbersInput/Output of OpenCV Data structuresInput/Output of vectors (arrays) and associative mapsRead and write your own data
2020-10-31 17:19:26
647
原创 从头开始opencv(十)——core:Discrete Fourier Transform
从头开始opencv(十)——core:Discrete Fourier TransformGoalCodeExplanationExpand the image to an optimal sizegetOptimalDFTSize()copyMakeBorder()Make place for both the complex and the real valuesmerge()Make the discrete Fourier Transformdft()Transform the real and
2020-10-26 22:00:22
451
原创 从头开始opencv(九)——core:random generator and text
从头开始opencv(九)——core:random generator and textGoalsCodeExplanationDrawing_Random_Lines()Drawing_Random_Rectangles()Display_Random_Text()完整代码对官方教程的改进GoalsUse the Random Number generator class and how to get a random number from a uniform distribution(使用R
2020-10-25 21:55:43
429
3
原创 从头开始opencv(八)——core:Basic drawing
文章目录GoalsOpenCV TheoryPointScalarCodeellipse()Circle()fillPoly()rectangle()Line()Goals画一条线画一个椭圆画一个矩形画一个圆画一个填充多边形OpenCV Theory 我们将会频繁使用的是:cv::Point()和cv::Scalar()Point 代表了一个二维的点的坐标。//method 1Point pt;pt.x = 10;pt.y = 8;//method 2Point
2020-10-24 21:52:28
307
原创 从头开始opencv(七)——core:changing the contrast and brightness of an image
从头开始opencv(七)——core:changing the contrast and brightness of an imageGoalTheoryImage ProcessingPixel transformsBrightness and contrast adjustmentssaturate_cast()函数Practice exampleGamma correctionGoalaccess pixel values(得到对应像素点的值)Initialize a matrix wit
2020-10-23 21:44:51
354
原创 从头开始opencv(六)——core:Adding two images
从头开始opencv(六)——Adding two imagesGoalTheoryaddWeighted()源码Goalwhat is linear blending and why it is useful;[什么是线性混合,以及它为什么有用]how to add two images using addWrighted()Theoryg(x)=(1−α)f0(x)+αf1(x)g(x)=(1-\alpha)f_0(x)+\alpha f_1(x)g(x)=(1−α)f0(x)+α
2020-10-21 21:49:56
260
原创 从头开始opencv(五)——core:operations with images
从头开始opencv(五)——core:operations with imagesInput/OutputBasic operations with imagesAccessing pixel intensity valuesPrimitive operationsInput/OutputBasic operations with imagesAccessing pixel intensity valuesScalar intensity = img.at<uchar>(y, x)
2020-10-20 20:06:46
184
原创 从头开始opencv(四)——core:Mask operations on matrices
Mask operations on matricesour test caseThe Basic MethodThe filter2D function Mask operations on matrices are quite simple. The idea is that we recalculate each pixels value in an image according to a mask matrix (also known as kernel). This mask holds
2020-10-19 22:00:47
278
原创 从头开始opencv(三)——core:How to scan images, lookup tables and time measurement
从头开始opencv(三)——core:How to scan images, lookup tables and time measurementGoalOur test caseGoalOur test case Let us consider a simple color reduction method. By using the unsigned char C and C++ type for matrix item storing, a channel of pixel may ha
2020-10-18 17:12:40
419
原创 从头开始opencv(二)——core:Mat
从头开始opencv(二)——The Core Functionality:MatMat - The Basic Image ContainerGoalMatStoring methodsLoad and Display an ImageLoad, Modify, and Save an ImageCreating a Mat object explicitly参考资料Mat - The Basic Image ContainerGoal 图像在计算机中是以像素点阵的形式进行存储的。Mat
2020-10-05 10:57:46
509
原创 从头开始opencv(一)——opencv安装和模块介绍
从头开始opencv(一)一、安装环境介绍二、opencv模块介绍 由于opencv之前就有一直在用,所以安装就不打算再看了,等以后对计算机更为理解了再来看看为什么是这种安装方法吧(先给自己挖一个大坑)。 打算跟着大佬一篇博客一篇博客开始啃。 本文跟着的博客【OpenCV入门教程之二】 一览众山小:OpenCV 2.4.8 or OpenCV 2.4.9组件结构全解析一、安装环境介绍 大佬用的环境是2.4.8,我用的环境是3.4.1(下载链接) 进入\opencv\build\inc
2020-10-04 10:29:08
176
原创 数据压缩(十五)——H.264编码
H.264编码H.264编码原理H.264编码实验输入格式生成一个适合你的列表SmartyPants创建一个自定义列表如何创建一个注脚H.264编码原理H.264编码实验输入格式 在代码中发现:void ParseCommand(InputParameters *p_Inp, int ac, char *av[]){ char *content = NULL; int CLcount, ContentLen, NumberParams; char *filename=DEFAULT
2020-08-11 17:31:20
1456
原创 数据压缩(十四)——AR模型的参数估计阅读
文章目录一、AR模型二、AR模型参数的估计2.1 AR模型参数和自相关函数的关系2.1.1 推导过程2.1.2 举例说明一、AR模型 ARARAR模型是随机信号参数模型的一种。 ARARAR模型中,随机信号x(n)x(n)x(n)由本身的若干次过去值x(n−k)x(n-k)x(n−k)和当前的激励值w(n)w(n)w(n)线性组合产生。x(n)=w(n)−Σk=1pakx(n−k)x(n)=w(n)-\Sigma^p_{k=1}a_kx(n-k)x(n)=w(n)−Σk=1pakx(n−k
2020-06-19 12:13:28
2568
原创 数据压缩(十三)——MPEG音频编码原理及编码器调试
文章目录MPEG音频编码原理基本思想心理声学模型(Psychoacoustic model)听觉阈值频域掩蔽临界频带(Critical Band)人耳听觉系统掩蔽效果的加和MPEG音频压缩编码器多相滤波器组用来分割子带量化和编码比例因子的取值和编码比特分配及编码数据帧包装MPEG音频编码原理基本思想 分析信号,去掉不能被感知的部分【声音压缩算法可以确立这种特性的模型来取消更多的冗余数据】子带分析滤波器组:使信号具有高的时间分辨率【短暂冲击信号情况下,编码的声音信号具有足够高的质量】FFT运
2020-06-08 20:43:15
2753
2
opencv3.4.1
2020-10-03
digital_yasuo.zip
2020-03-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人