自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 00_音视频处理_视频压缩

MPEG-2 在MPEG-1的基础上支持scalable coding,支持interlaced video, 支持更高质量的视频。寻找到与当前处理的像素点最相近的元素,motion vector 为reference 指向 current 处理的方向。视频压缩技术主要是为了在保证视频质量(即不影响人类观感)的情况下,尽可能的减少其所占的内存。MPEG 的GOP包含三类frame, I-frame, B-frame, P-frame。视频的结构可以如下图所示:一个完整的视频由连续的frame组成。

2025-03-16 09:40:53 602

原创 04_DeepLearning_SVM

在一个多维输入空间内,如果数据模式是非线性可分的,那么可以将一个非线性映射将其投影至更高维的特征空间,使得数据具有更高的概率变的线性可分。软间隔SVM允许一定程度的分类错误,以适应数据中可能存在的噪声和不可分数据点。因此,SVM的目标可以转化为:寻找到使分类间隔最大化的超平面。但在高维空间内,显式计算的计算量很大甚至不可行。线性分类器的主要目的是:寻找一个超平面可以准确的并且具有较高置信度的对数据进行二分类。通过非线性映射到高维线性空间,后应用SVM处理。是对称的并且是半正定的,则。对于任意有限个样本点。

2025-03-04 17:17:56 802

原创 03_DeepLearning_RBF

RBF 包含一个隐藏层的神经网络。其主要包括输入层,隐藏层和输出层。其中输入层不做任何计算,只提供输入。隐藏层做非线性变化,仅和输入中心向量附近的区域会做响应。输出层是一个线性分类层。初始值:输入层和隐藏层之间的权重都设置为1. 其中隐藏层有三个重要的参数需要设置:中心变量,RBF函数以及sigma参数(控制邻域范围大小)。其中中心变量:1)随机选择2)k-means 3)feature selectionRBF函数:高斯函数,inverse multi-quafratic function。

2025-03-02 21:54:01 880

原创 02_DeepLearning_SOM

初始化:随机初始化权重向量,初始化的随机权重需要互不相同,而且应该权重幅值尽可能小抽样在训练样本集中随机选择采用最小欧式距离准则,选择获胜的神经元更新更新获胜神经元以及拓扑邻域内神经元的权重向量迭代至满足要求停止准则:迭代次数达到预设值映射不在发生明显的变化(权重)输入空间的近似输入空间的数据,可以用输出空间近似表示拓扑排序,拓扑空间的位置对应输入空间的特定区域可以反应输入空间分布的统计特征,密度大的区域,对应输出空间的神经元数量多。

2025-02-27 11:57:11 787

原创 08_Machine Vision_图片分类

Outline。

2025-02-25 15:52:48 863

原创 01_DeepLearning_基础介绍

其直观理解为:获胜的神经元向输入靠拢,使其更加擅长识别类似的模式,即下次还会赢。也可以理解为空间中的向量,即下一次更新的方向为输出的神经元指向输入神经元方向。一组相同的神经元,在受到外界刺激的时候输出激活值不一样。通过竞争的方式,确定获胜的神经元,更新获胜神经元的权重。过拟合指在训练集上表现很好,但在测试集上表现很差。神经网络的训练是通过已知的知识,使用合适的算法,调整确定神经网络中各个权重的过程。最简单的情况是单层神经网络,只有输入层和输出层。为第n次迭代时的权重变化量,为第n次迭代时的权重,

2025-02-23 16:57:27 728

原创 07_Machine Vision_图像分析

前面的做法都是先平滑在求梯度,实际相当于对所有像素点梯度做加权平均。但是梯度方向和边缘方向存在不对称,则两个方向相反的梯度向量,在求和的时候可能会相互抵消,导致出现错误。局部主导方向代表了某一区域内的主导方向,主要表示图像中的边缘、线条等信息。通过上述的方法可以检测出边界,接下来需要将检测出来的边界合在一起,形成连贯的边界。但以上两种算法受到噪声的影响很大,在使用之前,应该先对图像做平滑处理(低通滤波)。可能存在的问题是:因为先进行了平滑滤波,可能会导致梯度方向出现偏差。不同的滤波器要设计不同的梯度算子。

2025-02-18 17:47:18 603

原创 06_Machine Vision_图像分割

图像分割是将图像划分成多个有意义的区域,当已经成功提取出感兴趣的对象时,分割过程就应该停止。传统的图像分割算法主要基于像素的相似性(阈值定义相似区域)和不连续性(像素突变)来划分。最简单的方式是用一个卷积滤波器来检测图像中的不连续性。可识别出孤立的中心点。

2025-02-17 22:30:34 510

原创 00_LLM 读论文系列:Chain of Thought Prompting Elicits Reasoning in Large Language Models

理解:仍然不清楚为什么思维链会起作用以及怎么产生的,更多的是直觉上的因为有了中间的推理步骤以及大模型的涌现作用。由于scaling law的存在,大家不断地增加大模型的size,进而提高大模型的性能表现。然而在复杂的推理问题上,仅仅提高大模型的size不能完全的解决问题。消融实验指的是评估某个系统的不同组件对整体性能的影响时,通过逐步移除某些组件,进而研究不同组件对于整个系统的影响。2)传统的小样本的学习方法在推理能力上表现不是很好,而且随着语言规模的增加,性能提升不显著。

2025-02-16 23:00:38 670

原创 05_Machine Vision_图像恢复

由此可知:运动模糊的频率响应为一个方向性的sinc函数,表明其会有周期性的零点,在这些零点处,信息弯曲丢失,这也是使得恢复变得困难的原因。除了随机噪声外,在实际图像处理的过程中还会遇到结构化噪声,如周期性噪声等。周期性噪声是在特定频率出现的噪声,通常为规则的波纹或者条纹。图像恢复是基于数学模型的客观的恢复过程,需要关于退化过程的先验知识对图像进行重建。也是去除特定频率噪声的滤波器,但是与带阻的区别是,只去除特定频率点的噪声,而不是整个频带。是噪声的放大项,也是主要逆变换需要考虑的问题。

2025-02-16 22:49:03 763

原创 04_Machine Vision_形态学图像处理

腐蚀主要是可以看作是结构元素在图像上滑动,如果结构元素的所有像素都在图像中,则保留该像素,否则去除该像素。计算后目标区域会变小,边缘像素会被去除,比如孤立的噪声点。膨胀可以看作是用结构元素扫描图像,如果遇到相同的元素,则膨胀图像。开运算是一种复合运算方式,先腐蚀后膨胀,可以平滑对象边界,去除小噪声,保留主要结构。闭运算是开运算的对偶运算,先膨胀后腐蚀,可以平滑对象边界,填充小孔,保留主要结构。最常见的处理对象是二值图像,但也可以处理灰度图像。是结构元素,用于定义膨胀操作的作用范围。

2025-02-13 14:05:08 713

原创 03_Machine Vision_非线性滤波器

线性处理滤波相当于对像素点做加权处理,可能会导致细节丢失,出现模糊的现象,针对强噪声会出现无法消除的问题。此数据反映数据的对称性,若数值较大,则偏态严重。中值滤波的核心思想是:用中心像素点的邻域像素值的中值作为中心点的灰度值。相对均值滤波可以更好的保留边缘信息。是去除极端像素后剩余的像素值,d是去除的像素个数,mn是滤波窗口的像素个数。迭代截断算数均值滤波器,集合均值和中值的优点,同时避免中值的高复杂度。反映整体数据的波动性,如果数值较大,则数据包含极端值。在存在极端值的情况下,均值和中值的差距会很大。

2025-02-12 16:59:28 494

原创 02_Machine Vision_图像增强

直方图均衡化的主要目的是:输出图像的直方图尽可能的均匀,避免图像聚集在亮度或者暗部区域,是图片包含更多细节,更具有层次感。图像平滑的主要目的是去除图片中的噪声和细节,核心是利用低通滤波器抑制图像中的高频成分,保留低频信息。其中,f为输入像素值,通常先归一化到[0,1]之间,c为常数,控制图像变换的。图像锐化主要是抑制低频成分,保留高频成分,进而保留图片的更多细节。图像变暗,高亮度部分被压缩,中间值降低,所以图像变暗。其中,f为输入图像,g为输出图像,T为变换函数。其中,L为最大的灰度级,

2025-02-11 17:42:38 424

原创 01_Machine Vision_LSI及傅立叶变换

图像由基本的像素点组成,如果将每一个像素点看作一个脉冲,则每个像素点的值可以看作是脉冲的幅值,这样图像就可以看作是由一系列脉冲组成的。单个像素点的数学表达式:f(i,j)=Aδ(x−i,y−j)f(i,j) = A\delta(x-i,y-j)f(i,j)=Aδ(x−i,y−j)其中,A是像素点的幅值,δ(x−x0,y−y0)\delta(x-x_0,y-y_0)δ(x−x0​,y−y0​)是二维脉冲函数,表示在(x0,y0)(x_0,y_0)(x0​,y0​)处的脉冲。则图像可表示为一些列脉冲的叠加,

2025-02-09 23:48:11 844

原创 00_Machine Vision_基础介绍

数字图像是三维物体的二维表现形式。数字图像处理是对原有图像进行修改、或者提取、识别有用的信息。图像直方图是指将图像的灰度级作为随机变量,则P(f)即为随机变量的概率分布。其中,n为图像的像素总数,n_f为灰度级为f的像素数目。

2025-02-09 23:44:15 630

原创 05_Python学习基础

5\ 运算符的计算优先级:结合性指的是当表达式终出现多个有优先级相同的运算符,先执行哪一个。先执行左边为左结合性。其中,list 和 tuple 都是按顺序保存元素,所有的元素占用一块连续内存,且都有自己的索引。2\ is 和 == 的不同, == 判断的是值是否相同,is 判断的是对象是否相同,主要根据对象的地址判断,如果使用同一块内存,则为一个对象。1\ 位运算符操作的是数据在内存中存储的原始二进制位,而不是数据本身的二进制形式。反码:正数的反码就是原码,负数的反码是除符号位意外所有位按位取反。

2023-04-04 10:39:22 1121

原创 04_Python学习基础---基本函数语法格式

flush: 控制输出的韩村,默认为False,一般不动,为获取较好的性能。end: 输出结束之后的参数,默认为换行。file:输出的的目标显示,默认为屏幕。sep: 连续输出的分割,默认为,

2023-03-30 14:55:46 857

原创 03_Python学习基础---变量类型以及运算符

小数点后面的部分在转化成二进制时很可能是一串无限循环的数字,无论如何都不能精确表示,所以小数的计算结果一般是不精确的。主要编码方案分为三种,UTF-8,变长的编码方案,使用1-6个字节存储。UTF-32,固定长度的编码方案,始终4个字节存储。4)string也可通过encode('UTF-8') 的形式转化为bytes,bytes通过decode('UTF-8')形式转化为string.3)实际应用过程中,如果string都是ASCII字符,直接在string前面加b前缀即可转换为bytes类。

2023-03-30 14:55:41 1264

原创 02_Python 学习基础

7\ 内置函数与标准库函数的区别:内置函数是解释器自带的,类似print。1)以单下划线开头的标识符号,表示不能直接访问的类属性,无法通过 from...import***导入。4)标识符做包的名称时,应尽量短小。3)模块内部的类名,可以采用“下划线+首字母大写的形式”重点:除非特定场景需要,应避免使用以下划线开头的标识符。3)以双下划线作为开头和结尾的标识符,是专用标识符。2)函数名、类中的属性名和方法名,应全部小写字母。2)以双下划线开头的标识符,表示类的私有成员。3) 基于google的代码规范,

2023-03-30 10:23:16 940

原创 01_Python学习基础

其中,解释型语言,执行程序都需要一边转换一边执行,用到的源代码就将哪些源码转换为机器码,用不到就不做处理。所以计算机的底层功能、关键算法一般都会选用编译型语言,甚至会直接选取二进制语言处理。编译型语言,一般都是闭源产品。解释型语言使用时无法脱离开发环境,一直都需要源代码和解释器,一般都是开源的。也就是说,解释器的接口是解释器,而编译器的接口是系统、平台。通过编译器转化的为编译型语言。其中编译型和解释型的区别如下:编译型语言需要将源码转换为CPU可识别的文件。而解释型语言无需预先编译,由解释器逐行解释。

2023-03-22 18:43:35 78

转载 蓝牙知识整理(一)发展概述

概述:蓝牙核心规范发展的主要版本:表1蓝牙核心规范发展介绍 版本 规范发布 增强功能 0.7 1998.10.19 Baseband、LMP 0.8 1999.1.21 HCI、L2CAP、RFCOMM 0.9 1999.4.30 OBEX与IrDA的...

2020-05-11 18:17:58 709 2

原创 Spacedesk软件使用

1. 简介主要实现电脑分屏功能。2. 所需软件主机:必须下载软件spacedesk server (https://spacedesk.net/) downloadSPACEDESK DRIVER SOFTWARE分屏电脑:可选用软件或者网页版。 1)网页版:http://spacedesk.ph/html5viewer/ ...

2019-11-21 06:20:48 69419 9

原创 matlab调用ansys

1.版本:MATLAB R2014a ANSYS14.5 / MATLAB R2017a ANSYS17.02.思路:将MATLAB中的数据输出到shuju.txt中,用ANSYS读取shuju.txt后将计算计算结果输出到jieguo.txt中并将其返回到MATLAB中进行运算分析。3.程序:在MATLAB中输入fid=fopen('c:\shuju.txt','wt'); ...

2019-03-09 21:45:09 7638 10

原创 进制转换

1. 2进制转换为10进制    1)不带小数的2进制   例:10110=>     2)带小数的2进制       例:0.001=>         

2018-11-27 11:27:22 171

原创 DACE-Kriging 模型用法

1. 关于theta取值    Dace工具箱内dacefit函数自带theta 优化,只需在初始设置 theta0、lob 和upb即可。   猜测初始值theta0的选取,不影响最终结果。但是影响计算效率和加点数。     Dace工具箱手册内给的算例为:    theta=[10 10]; lob=[1e-1 1e-1]; upb=[20 20];    [dmodel,...

2018-11-26 15:58:23 24326 54

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除