- 博客(20)
- 收藏
- 关注
原创 强化学习—PPO代码实现及个人详解2(python)
batch 应该是一个包含多个列表(或其他可迭代对象)的列表,如 [[1, 2, 3], [4, 5, 6], [7, 8, 9]]。通过 zip(*batch),将这些子列表中对应位置的元素打包成元组,例如 (1, 4, 7)、(2, 5, 8)、(3, 6, 9)。首先初始化,这里并没有传入参数,但会创建一个空的双向队列 self.buffer。(2)函数注解中使用 -> None 表示该函数的返回值类型为 None,即函数不返回任何有意义的值,类似于在函数体中显式地使用 return None。
2024-04-03 10:45:48
1381
1
原创 论文研究3——模糊系统(1)
通常,我们让系统判断一件事时,回答大多应该是:是或者否,也就对应计算机中的1或者0,就好像我问你来了吗,你应该回答的来了或者没来,但是前段时间看视频,里面教授说了个很有意思的词,“如来”,来了吗,如来。就是好像来了,又好像没来,给人一种很模糊的感觉,其实模糊系统也是如此。
2023-09-28 16:00:52
880
原创 论文研究2——李雅普诺夫(Lyapunov)稳定性分析
本文简单的对李雅普诺夫(Lyapunov)第二法的判稳流程进行了介绍,并给出了一些例题
2023-09-20 17:59:26
19946
8
原创 数学建模6——路径规划的各种算法(Dijkstra、Floyd、A*、D*、RRT*、LPA*)
简单的对路径规划的几种经典算法进行介绍,最后简述了一下各方法的区别
2023-09-19 20:18:38
30823
原创 (五)分类算法——决策树
决策树,将大量的样本通过每一次分支后,将数据进行分类,(算是个,让数据按类别进行筛选)而分支上的条件是利用一定的训练样本,从数据中“学习”出决策规则,自动构造出决策树。比如下方的例子。在学习决策树之前, 我们需要先知道几个概念。根据上面的几个概念,我们根据划分标准的不同,衍生出了。具体使用哪个方法,要根据使用场景、样本数量、样本特征等情况进行分析和选择。
2023-09-12 09:53:11
300
原创 软件学习——Lingo
Lingo可以用来求解问题。前提:在该软件下,有几个默认条件。①LINGO默认所有变量是非负的。②LINGO中没有严格的和代表<=代表>=。③LINGO不区分变量的大小写。④LINGO的注释用!引出,用;结尾。
2023-09-07 16:21:07
299
原创 (二)评价模型——主成分分析(PCA)
首先先来说明一下,主成分分析现在多用来进行,将大量数据进行后,再使用其他的算法进行进一步的分析,降维可以去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为应用非常广泛的数据预处理方法。(这个方法一般需要结合使用)当然,如果要对数据进行降维处理,我们还有其他的方法:比如奇异值分解(SVD)、主成分分析(PCA)、因子分析(FA)、独立成分分析(ICA)。
2023-09-02 16:44:29
2444
原创 (一)优化模型——遗传算法
遗传算法具有很强的鲁棒性、随机性、自适应性。算法过程中的遗传、交叉及变异等操作都是通过轮盘赌的随机概率去实现的,增加了整个算法的灵活性,从而使得在进化的过程中产生更加优质的个体,提高整个种群的。
2023-09-02 15:04:06
999
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人