- 博客(10)
- 资源 (4)
- 收藏
- 关注
原创 强化学习基础
强化学习基础第零章 写在前面第一章 MDP模型和动态规划1.1 MDP模型1.2 动态规划1.3 利用动态规划的思想求解MDP第零章 写在前面本文希望将强化学习从头开始推导,大家都可以提出改进意见和建议,共同完善本文。笔者水平有限,时间有限,不足之处,望大家包容并指正,感谢。第一章 MDP模型和动态规划很多实际问题都可以被抽象出来,建模成MDP(Markov Decision Process)模型,因此我们只需要求解了MDP模型,原问题即可得到解决。1.1 MDP模型MDP模型大家应该很熟悉了,
2020-08-17 23:21:21
869
原创 Bazebo新手详细教程——官网教程翻译(2)
本机(macbook air2019)安装路径:usr/local/Cellar/gazebo11/11.0.0/Gazebo元件这个页面描述了Gazebo在运行时的每一个元件世界文件世界描述文件包含了仿真中的所有元素,包括机器人、光线、传感器、静态物体等。这个文件是用SDF(simulation description formate)编写的,并且有一个.world文件的扩...
2020-02-11 11:05:47
671
原创 神经网络基础汇总
本文总结了神经网络需要用到的基础知识。由于很多博文已经写的非常好了,我在这里也不必抄一遍,故直接送上链接(如有侵权,请联系删除,感谢!)。激活函数详解:https://zhuanlan.zhihu.com/p/32610035 损失函数详解: 交叉熵损失函数:https://zhuanlan.zhihu.com/p/35709485 MSE损失函数:https://zhuanlan.z...
2020-01-31 19:08:05
164
原创 线性系统卡尔曼滤波推导——从概率角度(用的是通俗易懂的数学)
线性系统中概率角度卡尔曼滤波推导数学引理:1、随机变量x和y分别满足正太分布 : ,若x和y独立,那么x和y的联合分布为
2019-07-03 21:41:51
728
原创 计算机控制系统——数字控制器设计之模拟控制器的离散化(Chapter 5)
我们这章要设计计算机中的控制器D(z),D(z)是Z域中的表达,是输出信号的Z变换与输入信号Z变换的比值,这个比值等式映射到时域中就是,这就是我们要找的时域中的控制算法。计算机控制系统典型图:我们假设:A/D D/A转换器的精度足够高,采样没有延迟,上述框图可以简化为下面框图:。。。略过一些前面的东西,不太明白,过段时间再来补充模拟控制器的离散化方法下面我们均认为模拟...
2019-05-10 23:19:51
7617
1
原创 关于深度学习平台搭建的一些事项
1、tensorflow中的cuda版本问题CUDA有两种版本,一种是驱动版本driver version,查看命令:nvidia-smi(右上角);一种是运行时版本runtime version,查看命令:pip list 或conda list(包管理器+list)cudatoolkit便是。两种版本必须对应,对应关系如下:CUDA 9.1 387.xxCUDA 9....
2019-05-10 23:18:05
265
原创 计算机控制系统中的Z变换
Z变换是针对于离散信号的变换,在计算机控制系统中我们常常先采样连续信号x(t),得到离散信号x*(t),然后对采样信号进行Z变换,把时域变为Z域。其意义之一在于离散控制系统传递函数可用Z域的函数来表示,进而确定元件或者系统的稳定性。Note:以下利用到的离散信号均用x*(t)表示,且认为其是x(t)经过采样之后得到的信号。并且认为t>=0时刻才有非0值,t<0时为0。Z变换的...
2019-04-19 00:38:09
6458
原创 快速回顾傅里叶系列——FS,FT,DTFT,DFT及其与数字控制系统的简单综合
Note:本手稿是简单快速回顾性手稿,有些地方可能会推导不严谨,或者没有推导,仅适用于简单回顾,也请大家多提意见,一同讨论;如有侵权,请联系删除,谢谢。先放一个典型的数字控制系统框图:再放一张乱七八糟的傅里叶变换、拉普拉斯变换、z变换关系图:好了,发现信号系统几乎不记得了,别着急,从头开始快速回顾一下吧~1、傅里叶级数(傅里叶展开)FS傅里叶展开是对周期性函数进行的。...
2019-04-18 01:04:00
1428
原创 一些有用的数学结论(线代、信号、控制、概率论)
本手稿记录了一些比较有用或者常用的(在工程问题中)可以用到的数学方面的小结论及其证明。Note: 该手稿为LTS(Long Time Service)1、时域中脉冲序列(采样信号)经过FT变换到频域中也为脉冲序列即时域中一系列脉冲函数的和(采样信号)如图(3),FT变换后如图(4),关于各种傅里叶参见另我的一篇博文。证:2、关于非周期(周期无穷大...
2019-04-16 22:31:23
382
原创 对于香农采样定律的简短理解
有没有觉得Nyquist采样定律很神奇,对于一个连续的信号,在一定频率下采样,根据采样得到的离散信号就能还原连续的信号!疑问:任意给一个采样后的离散时间序列,即便采样的频率再高,在任意两个点之间可以有无数种画法啊?如图1。为啥原信号一定就是频域中主频区傅里叶逆变换回来的那个连续信号? ...
2019-04-10 16:01:51
2738
电力系统分析潮流计算matlab完整程序(真的可以计算!)
2019-04-21
数字电路课程CPU设计(verilog完整代码+报告+设计图)
2019-04-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人