- 博客(56)
- 收藏
- 关注
原创 史密斯圆图解析
史密斯圆图是射频和微波工程中分析阻抗匹配的核心图形工具,通过归一化处理将复数阻抗或导纳转化为可视化的图形,极大简化了阻抗变换和驻波分析过程。首先归一化阻抗,找到对应的等电阻圆,沿该圆移动到对应的等电抗弧,假设归一化后,z=0.5+1,横向找到r=0.5的等电阻圆,沿该圆向上移动到 x=1的等电抗弧交点。沿传输线移动,等于在史密斯圆图上绕中心旋转,每移动λ/2,相位旋转360,顺时针旋转代表向信号源方向移动,逆时针旋转向负载方向移动。中心点(Γ=0):匹配(ZL=Z0)(Γ=-1):短路点(ZL=0)
2025-03-08 20:38:24
430
1
原创 强化学习中的值迭代算法与实现
首先 vpis是对s的真的 state value vhat是他的一个估计值,我们的目标就是让vhat尽可能逼近,如果 vhat的结构是确定的时候,他是一个直线,抛物线,或者是神经网络拟合的黑箱,那么vhat(s,w),s确定了,我们可以调节的就是w,我们要做的就是找到一个最优的w,让这个vhat去接近vpi,这个问题实际上就变成了一个 policy的问题,我给了一个策略,我要找到一个近似的函数vhat,让他去接近真实的state value,之后也可以得到action value。
2025-03-08 18:41:41
691
原创 强化学习数学基础(七)——时序差分
时间差分算法,TD 算法是一种结合了动态规划(DP)和蒙特卡罗(MC)方法思想的强化学习算法,它能够在不需要完整环境模型的情况下,通过与环境的交互学习得到最优策略,用于估计值函数等强化学习中的关键量.
2025-02-10 18:51:29
906
原创 强化学习数学原理(五)——随机近似与随机
首先有个random variable(随机变量)X,我们的目标就是求出他的expectation E(x),我们有一些iid的采样,xi,从1到n,求出均值但是如果有很多数据,我需要等很久,把所有数据都收集完成然后求平均;第二种方法是一种增量式的iincremental的方法,迭代式iterativ的方法,就是来多少,先算多少。首先针对k个,从x1一直到xk,求一个平均那我知道了wk+1,我们让k-1就是wk,就是前k-1个xi的平均数,我们就是找出wk和wk+1之间的关系。
2025-02-03 19:56:31
979
原创 强化学习数学原理(四)——蒙特卡洛方法
在强化学习中,要计算在策略pi下的状态 - 动作值函数 q(s,a),即从状态出发,采取动作a后,遵循策略pi所获得的期望回报。重复这个过程,直到到达终止状态,形成一个 episode,如(s0,a0,r0,s1,a1,r1,...,st,at,r),其中T是终止时刻,该 episode 的回报。从状态s出发,采取动作a,然后按照策略pi在环境中进行交互,直到到达终止状态,这一过程称为一个 episode,得到一个回报 g(s,a)。假设,有一枚硬币,抛硬币后,若正面朝上,定义随机变量X=1;
2025-02-01 23:29:02
1221
原创 强化学习数学原理(三)——迭代算法
上面是贝尔曼最优公式,之前我们说过,f(v)=v,贝尔曼公式是满足contraction mapping theorem的,能够求解除它最优的策略和最优的state value,我们需要通过一个最优v*,这个v*来计算状态pi*,而vk通过迭代,就可以求出唯一的这个v*,而这个算法就叫做值迭代。V(s)是状态s的最优价值,R是在状态s时执行动作a可获得的,y是折扣因子(衰减系数),还有状态概率矩阵P。后面给出代码验证
2025-01-27 22:51:07
907
原创 强化学习基本概念
主要还是复习的时候自己看,能理解一些主要的概念。说白了 优快云就是移动笔记,方便自己在外面闲着没事的时候,拿起来看一下,能够巩固这些知识,这一部分就是说明强化学习里面一些重要基础知识的
2024-12-17 19:41:16
517
1
原创 MATLAB深度学习(七)——ResNet残差网络
一、ResNet网络ResNet是深度残差网络的简称。其核心思想就是在,每两个网络层之间加入一个残差连接,缓解深层网络中的梯度消失问题二、残差结构在多层神经网络模型里,设想一个包含诺干层自网络,子网络的函数用H(x)来表示,其中x是子网络的输入。
2024-12-08 16:37:45
1510
1
原创 基于直线一阶倒立摆的控制(二)——LQR
对于 S 来说,他代表了末端状态的权重矩阵,一般情况这会是一个对角矩阵,Q代表运行当中的权重矩阵,R则是输入权重矩阵,这些矩阵都是对角阵,其他两个都是 n * n,但是R为 p*p。A是n阶方阵,如果对任何非零向量x,都有。其中呢,X为一个n*1的输入矩阵,u是一个p*1的输出,那么A状态矩阵,就是 n*n,B就是n*p的矩阵,这个是经典的线性系统离散的表达形式。Xd是我们要控制的目标,w是末端时刻,希望在w时刻的量尽量的靠近参考量,也就是最后状态,这个最后状态等同于下面的N时刻,这一块称之为末端代价。
2024-12-04 21:40:05
574
原创 基于直线一阶倒立摆的控制(一)——倒立摆建模
参考如下情景假设构建倒立摆系统:在无外力作用时,倒立摆安装在小车上不能保持垂直状态而左右倾斜,为此需要给小车在水平方向上施加适当的作用力。摆杆的位置是在车的顶部,所以高度为需要加上一半的车高,但如果为中心或者高度够小,就可以直接省略。· 摆杆的重力方向 z: 。其实这里问题最多的就是符号问题,前面的过程得到的位置不同,这里的符号也会不同。,分别为小车位移,旋转角度,小车速度,旋转速度,控制量为小车水平方向上受力:F。
2024-12-04 20:44:48
2202
原创 MATLAB深度学习(六)——LSTM长短期神经网络原理与应用
因此我们可以得出,t时刻的RNN网络具有两个输入,分别为t时刻的输入向量x与t-1时刻的隐含状态。该忘记门会读取上一个输出和当前输入,做一个Sigmoid 的非线性映射,然后输出一个向量(该向量每一个维度的值都在0到1之间,1表示完全保留,0表示完全舍弃,相当于记住了重要的,忘记了无关紧要的),最后与细胞状态相乘。从上面的分析我们就可以看到,一贯而终的记忆细胞 C,信息流通的路径,使得训练过程中的梯度信息长距离具有可行性,遗忘门f,输入门i,输出门o,来通过有用信息,删除以往信息。,会被加入到状态中。
2024-11-22 12:54:56
1386
原创 MATLAB神经网络(五)——R-CNN视觉检测
目标检测是解决图像中的物体是什么,在哪里的问题;R-CNN利用候选区域+卷积神经网络的方法,解决了图像中的定位问题,对于小规模数据集的问题,R-CNN利用AlexNet在ImageNet上预训练好的模型,基于迁移学习的原理,对参数进行微调。将我们的候选区域压缩到 227*227,输入到神经网络中获得4096维的矩阵,每个候选区域都有一个矩阵。第一步:首先会有很多候选框区域,这些区域是由图像分割的方法得到的原始区域然后进行合并,得到的一个层次化的区域,这些区域内就可能存在需要的内容。
2024-11-21 21:02:21
1370
1
原创 Matlab深度学习(四)——AlexNet卷积神经网络
TransferLearning,把一个领域的知识迁移到另一个领域。基于共享参数的迁移学习研究如何找到源数据和目标数据的空间模型之间的共同参数或先验分布。通过修改一个通过完整训练的深度卷积神经网络模型最后几层连接层,再使用针对特定问题而建立的小数据集进行训练,使其能够适用于一个新的问题。很可惜,我们因为不是正版,所以暂时不演示迁移学习。
2024-11-19 13:23:34
1341
原创 MATLAB深度学习(二)——如何训练一个卷积神经网路
从数学的角度看,机器学习的目标是建立输入和输出的函数关系,相当于 y = F(x)的过程。F(x)的获得,我们通过的是实验法啊,经过大量数据训练出来的,我们定义一个损失函数L(x),记录真实输出与模型输出的偏差,通过数据的迭代使得损失函数L(x)达到最小。过拟合和欠拟合是常见的现象。但是需要说明的是,数据没有过多的这种说法,所谓的过拟合,是模型在训练集上的表现过于优异,模拟考100分你考了100分,99分,但是验证集上,相当于实际考试中你考了40分,换一场考试,换一个新的数据,导致严重误判。
2024-11-18 11:43:56
622
原创 Matlab深度学习(一)——如何构建一个卷积神经网络
一个卷积神经网络通常包含多个卷积层,以AlexNet为例子,就有5个卷积层,在卷积神经网络的数字图像识别过程中,每层的特征将会更加抽象。同一个卷积层中可以有多个不同的卷积核,所得到的特征图的个数和卷积层的卷积个数有关(子卷积核是分别卷积后求和,当然也可以是别的计算方法)。第一层是图像输入层,通过卷积以及其他特定形式的运算从图像中提取特征,接下来每一层都以前一层提取出的特征作为输入进行卷积,得到更高级的特征。卷积核与图像的相似程度越高,得到的响应值越大,因此可以通过滑动卷积运算来提取图像的特征。
2024-11-17 20:52:08
2690
2
原创 ROS——Teb算法的优化
一、简介“TEB”全称Time Elastic Band(时间弹性带)Local Planner,该方法针对全局路径规划器生成的初始轨迹进行后续修正(modification),从而优化机器人的运动轨迹,属于局部路径规划。关于eletic band(橡皮筋)的定义:连接起始、目标点,并让这个路径可以变形,变形的条件就是将。二、说明。
2023-04-21 08:52:18
7090
6
原创 ROS导航
ROS部分我会出两章进行说明的文章,分别为ROS的基础知识和基本包使用,都会是从0重新开始,也方便自己学习,将会是从头开始写,所以预计耗时较长
2023-04-12 23:41:02
2806
原创 OpenMV入门
1. 什么是OpenMVOpenMV 是一个开源,低成本,功能强大的 机器视觉模块。OpenMV上的机器视觉算法包括 寻找色块、人脸检测、眼球跟踪、边缘检测、标志跟踪等。以STM32F427CPU为核心,集成了OV7725摄像头芯片,在小巧的硬件模块上,用C语言高效地实现了核心机器视觉算法,提供Python编程接口。(这也就意味着,我们可以通过python来对他进行编程,所以我们就需要学习一点基础的python知识)————————————————2. 关于OpenM...
2022-02-20 22:59:33
102789
22
原创 STM32——舵机驱动
前言舵机——能通过不同的程序设计,来旋转不同的角度,他不同与普通的电机,只能在通电时按照一定的速度旋转,而舵机的功能不是循环旋转,只是旋转一定的角度,通过舵盘旋转的角度,从而带动外部的机械结构,我们可以用于小车的方向控制,机器人的手臂控制等——————————————————-舵机的基本工作原理蓝色部分是舵机的主机,红色部分是舵盘,橙色箭头表示舵盘所在的角度PWM也就是波形输入,单片机需要通过IO端口在这条线上输入一个固定的波形,通过波形来让舵机旋转一定角度VCC(5V) GND
2022-02-15 14:00:28
17494
6
原创 C语言基础——结构体
前言结构体在STM32(标准库函数)里面是非常重要的一节,很多的东西都需要利用结构体来完成,所以我们在本章就说明一下结构体——————————————————————————————————————————目录· 结构体类型的声明· 结构体初始化· 结构体成员访问· 结构体传参————————————————————————————————————————一. 结构体的声明————————————1.1 结构的基础知识结构是一些值的集合,这些值称为成...
2022-01-26 13:31:20
1241
原创 C语言基础 —— 指针
前言学习 STM32 需要一些 C语言基础,其中 结构体 和 指针尤其重要,我们接下来我们就来学习一下 指针——————————————————————————————————————————
2022-01-18 16:48:05
3284
1
原创 STM32F103(七)——通用定时器的说明与功能
前言本节我们会对STM32的通用定时器功能进行说明和介绍,也是对 STM32(六) 与STM32(七)的总结————————————————————————————————————————
2022-01-18 11:49:21
12021
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人