Gowi_fly-优快云博客

原创神经网络优化算法

神经网络优化算法文章目录神经网络优化算法梯度下降算法批量梯度下降法随机梯度下降法小批量随机梯度下降法动量法NAGAdaGradRMSPropADADELTAADAMNADAM梯度下降算法以f(x)=12x2f(x)=\frac12x^2f(x)=21x2为例展示了梯度下降法中梯度下降的实际情况，图中的箭头表示梯度下降的方向。可以将xxx往导数的反方向移动一小步来减小f(x)f( x)f(x)即取x′=x−ϵf′(x)x^{\prime}=x-\epsilon f^{\prime}(x)x′=x−ϵ

2024-05-23 23:09:55 1110

原创神经网络中的归一化操作

由于样本不同特征的量纲或量纲单位不同，变化区间也处于不同数量级，使用原始样本训练机器学习或深度学习模型，不同特征对模型的影响会不同，这也导致训练所得的模型缺乏鲁棒性。归一化（Normalization）是一种常见的数据预处理方法，它将数据映射成 [0, 1]或者[-1, 1]之间的小数，是的模型更容易收敛到最优解。因此，在构造机器学习或深度学习模型之前，需要将数据做归一化处理，这不仅会加快求解的速度，还有可能提高模型的精度。

2024-05-23 15:59:09 1674

原创 ViLT 浅析

文章主要受到了ViT的影响设计一个Patch Embedding结构将图像特征序列化，并与文本特征进行模态融合。采用Patch Embedding结构使得整个模型训练大幅度加快，同时在许多任务上保持着较高的准确率。

2024-05-11 23:51:21 729

原创 CLIP 浅析

CLIP的英文全称是，即一种基于对比文本-图像对的预训练方法或者模型。

2024-05-11 21:39:14 3316

原创 LAPGAN浅析

在原始 GAN和CGAN中，还只能生成 16*16, 28*28, 32*32 这种低像素小尺寸的图片。而LAPGAN首次实现 64*64 的图像生成。与其一下子生成这么大的图像（包含信息量这么多），不如一步步由小到大，这样每一步生成的时候，可以基于上一步的结果，而且还只需要“填充”和“补全”新图片所需要的那些信息。

2024-04-26 18:33:25 762

原创 8点法估计基础矩阵

根据两幅图像中8个对应点对之间的关系，采用SVD求解最小二乘方。又因为一个矩阵乘上一个正交矩阵范数不变，所以即最小化。因为可能图像存在噪声干扰的情况，所以目标为最小化。的最小二乘解是对应于A的最小奇异值的奇异向量。的最小二乘解是对应于A的最小奇异值的奇异向量。也是方程的一个解，所以添加约束条件。的秩为2，因此最佳解为秩为2的。为特征值降序的对角阵，所以。求解线齐次坐标下的方程组。将A进行SVD分解，得到。的非零对角元素）则是。的非零特征值的平方根。又由于用SVD求解得到的。通常为满秩，而实际上。

2024-04-26 15:16:23 1377

原创 GAN 生成对抗神经网络

判别器是一个二分类器，用来判断一个图片是不是“真实的” ，它的输入是采样的真实图片𝒙以及生成器生成的图片𝐺(𝒛)，输出是输入图片是真实图片的概率，如果输入图片来自真实数据，那么判别器输出大的概率，否则，输出小的概率。此时，生成器生成的数据分布无限接近真实数据的分布，判别器判别不出输入的是真实数据还是生成的数据，输出概率都是百分之五十。GAN的设计灵感来源于博弈论中的零和博弈（Zero-sum Game），在零和博弈中，参与双方的收益是完全相反的，一方的收益必然导致另一方的损失，总收益为零。

2024-04-25 15:58:09 1824

原创双目视觉浅析

与第一个摄像机中心C的射线在第二幅图像上的投影。因此，存在一个从一幅图像上的点到另一幅图像上与之对应的对极线的映射。注意上面的推导在两个摄像机中心相同时不能采用.因为，如果 C是P和P’两个摄像机共同的中心，则。称为归一化摄像机矩阵，其中对于归一化摄影机矩阵的基本矩阵被称为本质矩阵。用归一化图像坐标表示对应点 x→x’时，本质矩阵的定义方程是。是图像上的点在归一化坐标下的表示。是第一幅图像的光心。，在另一幅图像中存在一条对应的对极线。为图像上的一点，设知道相机标定矩阵。是成像点在空间中的位置，

2024-04-25 10:21:08 1413

原创 LeetCode 287 寻找重复数字

给定一个包含n + 1个整数的数组nums，其数字都在[1, n]范围内（包括1和n），可知至少存在一个重复的整数。假设nums只有，返回。你设计的解决方案必须数组nums且只用常量级O(1)的额外空间。

2024-04-22 16:58:33 710

原创 LeetCode279 完全平方数

是一个整数，其值等于另一个整数的平方；换句话说，其值等于一个整数自乘的积。例如，149和16都是完全平方数，而3和11不是。

2024-04-22 12:01:33 446

原创 LeetCode238 除自身以外数组的乘积

给你一个整数数组nums，返回数组answer，其中answer[i]等于nums中除nums[i]之外其余各元素的乘积。题目数据数组nums之中任意元素的全部前缀元素和后缀的乘积都在整数范围内。请 **不要使用除法，**且在O(*n*)时间复杂度内完成此题。nums。

2024-04-21 13:04:09 267

原创 DLT 直接线性变换

对于单应变换xi′Hxi，易知两图中对应的特征点，如何找出所需要的H，为了解决这个问题，可以采用DLT算法。

2024-04-19 19:07:22 1168

原创 Swin Transformer 浅析

于是Layer l+1的第2个窗口（从1开始计算）综合了layer l的第1个和第2个窗口的信息，Layer l+1的第5个窗口（从1开始计算）综合了layer l的所有窗口的信息，所以可以综合获得全局信息。从阶段2开始，之后的每一阶段都是一个像素块合并层和Swin Transforme块，其中像素块合并层类似于卷积神经网络中的池化层，经过像素块合并层之后，数据的宽和高为原先的1/2，通道数为原先的2倍。Swin-T将特征图划分为多个窗口，然后对每一个窗口进行自注意力的计算，这可以有效的的减少计算量。

2024-04-19 00:17:55 1321

原创 Vision Transformer (ViT)浅析

为了将Transformer引入视觉任务，Google团队开发出了Vision Transformer (ViT)，其中ViT模型以及变种在图像分类任务上一骑绝尘。

2024-04-17 20:34:26 963

原创 GPT 浅析

在模型实现上，GPT-2仍然使用Transformer作为主干模型，与GPT-1的整体架构类似，只进行了少量修改，包括层归一化被移到每个块的输入部分，起到类似预激活的作用，在最终的自注意力块之后又增加了额外的层归一化，同时Transformer的Decoder层数从GPT-1的12层增加到了24层、36 层和48层。在开发GPT-3的过程中，研究人员发现，模型增大之后，引入一些质量较差的数据带来的负面影响变小了，因此与GPT-1和GPT-2相比，GPT-3开始使用Common Crawl数据集进行训练。

2024-04-16 11:06:31 1049

原创 LoG 斑点检测

则可以发现随着尺度的不断增大，LoG曲线由双波谷逐渐融合成单波谷并趋于水平，导致响应也随着尺度的增大而减小，从而无法确定选定的尺度是否合适，不知道该尺度下找到的极值点是不是对应着斑点的中心点，为了解决这一个问题，从而提出了LoG归一化的操作。斑点检测：计算不同的尺度计算LoG响应，选择产生最强响应的尺度，在该尺度上对应的极值点就是斑点的中心位置。可知当LoG的尺度与斑点的宽度匹配时，LoG的幅值在斑点的中心取得最大值（信号正负极与高斯函数相同时）用不同尺度的LoG和信号卷积，寻找幅值的最大值。

2024-04-14 23:52:40 979

原创 LeetCode-236二叉树的最近公共祖先

给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。最近公共祖先的定义为：“对于有根树 T 的两个节点 p、q，最近公共祖先表示为一个节点 x，满足 x 是 p、q 的祖先且 x 的深度尽可能大（[2, 105]Node.val互不相同p!= qpq。

2024-04-14 13:14:11 368

原创神经网络--反向传播算法推导

神经网络–反向传播算法推导文章目录神经网络--反向传播算法推导概述神经网络模型反向传导算法概述以监督学习为例，假设我们有训练样本集(x(i),y(i))(x^{(i)},y^{(i)})(x(i),y(i))，那么神经网络算法能提供一种复杂且非线性的假设模型h(W,b)(x)h_{(W,b)}(x)h(W,b)(x),它具有参数WWW，bbb，可以以此参数来拟合我们的数据。为了描述神经网...

2024-04-13 23:58:52 1164 1

原创 Transformer 结构浅析

使 PE 能够适应比训练集里面所有句子更长的句子，假设训练集里面最长的句子是有 20 个单词，突然来了一个长度为 21 的句子，则使用公式计算的方法可以计算出第 21 位的 Embedding。接受来自上一层Add&Norm的输入并计算Q矩阵然后根据 Encoder 的输出计算得到 K, V，后续的计算与之前的一致。空间中，然后根据缩放点积进行打分，最后使用softmax的到概率，最后与value相乘的到输出结果。然后将多头注意力的结果输入到Add&Norm层中，其中这部分采用残差连接的方式构成。

2024-04-13 15:42:44 1571

原创 Attention 注意力机制浅析

自上而下的有意识的注意力，称为聚焦式注意力（Focus Attention）．聚焦式注意力也常称为选择性注意力聚焦式注意力是指有预定目的、依赖任务的，主动有意识地聚焦于某一对象的注意力自下而上的无意识的注意力，称为基于显著性的注意力（Saliency Based Attention）．基于显著性的注意力是由外界刺激驱动的注意，不需要主动干预，也和任务无关．。

2024-04-12 22:28:09 1182

原创 Harris 角点检测器

处的窗口函数，表示窗口内各像素的权重，最简单的就是把窗口内所有像素的权重都设为1。窗口移动引起的灰度值的变化值。根据 R 的值，将这个窗口所在的区域划分为平面、边缘或角点。其中若为竖直边缘，则c=0，若为水平边缘，则a=0。角点/斑点：在所有方向移动，窗口灰度值有较大改变。此为窗口在各个方向上移动所造成的像素灰度值的变化。因为M是对称矩阵，所以可以进行特征值分解，可得。平坦区域: 在所有方向移动，窗口灰度值不改变。边缘：沿着边缘方向移动，窗口灰度值不改变。，这个位置的像素灰度值为。

2024-04-12 00:39:20 914

原创相机模型浅析

相机实质上就是完成一个3D空间到2D平面的投影的过程其中投影中心称为摄像机中心，也称为光心摄像机中心到图像平面的垂线称为摄像机的主轴或主射线，而主轴在图像平面的交点称为主点。②相机坐标系（光心坐标系）：以相机的光心为坐标原点，X 轴和Y 轴分别平行于图像坐标系的 X 轴和Y 轴，相机的光轴为Z 轴，用。④像素坐标系：以 CCD 图像平面的左上角顶点为原点，X 轴和Y 轴分别平行于图像坐标系的 X 轴和Y 轴，用。一般，空间点采用不同的欧氏坐标系表示，称为世界坐标系。，在相机坐标系中的坐标为。

2024-04-09 20:21:36 1745

原创 2D运动模型

其中相应的运动可以通过变换矩阵实现。

2024-04-09 19:02:06 951

原创射影几何基础

射影几何基础文章目录射影几何基础2D2D点2D直线二次曲线3D3D点3D 平面3D直线2D2D点欧氏空间中的笛卡尔坐标，缩放、旋转和仿射变换能表示成矩阵运算（线性）；但平移变换和透视投影不能表示成矩阵相乘。所以为了解决这个问题引入齐次坐标，其中齐次坐标有如下特性：所有2D/3D几何变换可表示成矩阵运算/线性变换 X′=HXX'=HXX′=HX可以表示无穷远点笛卡尔坐标系齐次坐标系2D(xw,yw)(\frac{x}{w},\frac{y}{w})(wx,wy

2024-04-08 16:29:10 852

原创 Spring Cloud+Spring Alibaba笔记

通过"冷启动"，让通过的流量缓慢增加，在一定时间内逐渐增加到阈值上限，给冷系统一个预热的时间，避免冷系统被压垮。Sentinel能够对流量进行控制，主要是监控应用的QPS流量或者并发线程数等指标，如果达到指定的阈值时，就会被流量进行控制，以避免服务被瞬时的高并发流量击垮，保证服务的高可靠性。热点参数限流会统计传入参数中的热点参数，并根据配置的限流阈值与模式，对包含热点参数的资源调用进行限流。直接：是默认的流量控制方式，当QPS超过任意规则的阈值后，新的请求就会被立即拒绝，拒绝方式为抛出。

2024-03-28 14:52:07 771

原创 LeetCode 128 最长连续序列

给定一个未排序的整数数组nums，找出数字连续的最长序列（不要求序列元素在原数组中连续）的长度。请你设计并实现时间复杂度为O(n)的算法解决此问题。

2024-03-08 13:28:10 529 1

原创 LeetCode 121 买卖股票的最佳时机

给定一个数组prices，它的第i个元素prices[i]表示一支给定股票第i天的价格。你只能选择买入这只股票，并选择在卖出该股票。设计一个算法来计算你所能获取的最大利润。返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润，返回0。

2024-03-08 10:41:05 448

原创 LeetCode 79 子集

给你一个整数数组nums，数组中的元素。返回该数组所有可能的子集解集包含重复的子集。你可以按返回解集。

2024-03-07 14:35:02 478

原创 LeetCode 72 编辑距离

给你两个单词word1和word2，请返回将word1转换成word2所使用的最少操作数*。word2。

2024-03-07 13:13:00 554

原创 LeetCode -55 跳跃游戏

给你一个非负整数数组nums，你最初位于数组的。数组中的每个元素代表你在该位置可以跳跃的最大长度。判断你是否能够到达最后一个下标，如果可以，返回true；否则，返回false。

2024-03-02 22:40:27 589

原创 LeetCode 39 组合总和

如果至少一个数字的被选数量不同，则两种组合是不同的。，并以列表形式返回。中可以使数字和为目标数。对于给定的输入，保证和为。

2024-03-02 14:28:15 528

原创 final 类、变量与方法

在Java中若存在有类被final修饰，则该类不可被继承。如果将某个类设置为final形式，则类中的所有方法都被隐式设置为final形式，但是final类中的成员变量可以被定义为final或非final形式。

2024-03-02 10:34:14 386

原创 Java中的equals()方法

获得类的hash，但是因为hash表的特性，不一定hash相等的两个类就是同一个类（hash冲突），所以当且仅当hash相等的同时，为True才认为两个类是相等的。其余情况则认为不等，这样降低了equal的使用频次，所以在重写。在Java中所有的类继承自Object类。被重写表示两个字符串的内容是否相等。比较两个类，但是在String类中。其中Object类默认提供了。而在Java中可以通过。

2024-03-01 20:42:01 399

原创封装、继承与多态

是指把一个对象的状态信息（也就是属性）隐藏在对象内部，不允许外部对象直接访问对象的内部信息。但是可以提供一些可以被外界访问的方法来操作属性。是指将不同类别的类抽象出一个父类，其中这些类都继承自父类。在面向对象中封装、继承与多态是其三大特征。表示一个对象具有多种的状态。

2024-03-01 14:36:16 409

原创国科大计算机网络实验 HTTP服务器

server.c文件是一个用C语言编写的程序，它使用在basefun.h中声明并在basefun.c中定义的函数来创建一个能够同时处理 HTTP 和 HTTPS 请求的服务器。它定义了两个主要功能，和，并使用main函数来初始化和运行这些服务器。HTTP 服务器（函数）初始化用于 HTTP 的服务器套接字将套接字绑定到指定的 HTTP 端口（），并监听传入的连接使用while循环不断地接受新的客户端连接对于每个客户端连接，它会 fork 一个新进程来处理请求子进程调用。

2024-03-01 11:29:26 2262

原创 Java中的static

同一个类的静态变量共享同一个内存空间，即静态变量也就是被static关键字修饰的变量。它可以被类的所有实例共享，无论一个类创建了多少个对象，它们都共享同一份静态变量。从变量在内存中的存储方式来看，如果成员变量是使用static修饰的，那么这个成员变量是属于类的，如果没有使用static修饰，这个成员变量是属于实例的。

2024-02-29 21:12:25 494

原创 LeetCode 31 下一个排列

就是在这个有序容器中排在它后面的那个排列。如果不存在下一个更大的排列，那么这个数组必须重排为字典序最小的排列（即，其元素按升序排列）。是指其整数的下一个字典序更大的排列。更正式地，如果数组的所有排列根据其字典顺序从小到大排列在一个容器中，那么数组的。就是将其所有成员以序列或线性顺序排列。修改，只允许使用额外常数空间。

2024-02-26 15:11:46 443

原创矩阵分析与应用大作业李保滨国科大

2、可以用matlab、Python等编写程序，需附上简单的程序说明，比如参数代表什么意思，输入什么，输出什么等等，附上相应的例子；3、一定是可执行文件，例如 .m文件等,不能是word或者txt文档。附上源代码，不能为直接调用matlab等函数库;1、一个综合程序，根据选择参数的不同，实现不同的矩阵分解；在此基础上，实现Ax=b方程组的求解，以及计算A的行列式；

2024-01-23 09:21:04 683

原创纳什议价解

局中人在网络中所处的位置决定了他们的议价权，并最终导致不同的局中人在博弈中所获得的收益大小不同。下图给出了A、B、 C、D 四人参加网络交换博弈的一个稳定结局，其中粗线相连的节点之间达成交换，交换所得效益标记在了节点上方。解：如图所示，A 和 B 达成交易，C 和 D 达成交易。A 和 D 处于网络边缘，备选项收益为 0。B 的备选项是和 C 进行交易，备选项收益为。另外，由于A 和 B 达成交易，C 和 D 达成交易，有。C 的备选项是和 B 进行交易，备选项收益为。根据纳什议价解的公式，存在。

2024-01-07 23:17:24 1574

原创图像的腐蚀与膨胀

的补集是不包含于集合。的闭操作就是简单地用。

2024-01-03 11:55:14 425

南华大学@USC2019春季学期C++程序设计实验解答（余童兰老师教）

2018C语言夏秋季学期实验解答@USC南华大学（陈星老师教）

pycharm 打开摄像头失败