学习笔记
文章平均质量分 52
mhuang..
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
神经网络难以训练?-梯度消失问题
在一个标准神经网络中,对于不同层的训练速度是显著不同的,其原因在于反向传播中传递到每个层的增量是累乘的,如果神经元w设置在(0,1)之间,那么很有可能在经过若干层传递到最前面的层后对应的增量已经非常小,这就是所谓的梯度消失问题。另外一种情况是内层的梯度被外层大很多, 叫做exploding gradient problem。这种现象普遍存在于神经网络之中, 叫做: vanishing gradient problem。按照平时随机从正态分部(0,1)中随机产生权重的方法, 大部分|w| < 1。转载 2022-11-01 17:27:29 · 224 阅读 · 2 评论 -
强化学习中Sara算法和Q-Learning算法的区别
注:Q(s1,a1) = Q(s1, a1)+ α(Q-target - Q(s1,a1)) # α是学习率。Q-target = R + γ*在状态S2中最优的下一步Q(s2, *a)的值。4,由Q-target和原先的Q(s1,a1)去更新得到新的Q(s1,a1)3,由a1的奖励R,和Q(s2,a2)得到Q-target。2,由环境S2选出将要下一步要进行的a2。1,在环境S1中选出动作a1并得到S2。3,更新s1,a1这个状态的Q值。1,在环境S1中选出动作a1。2,得到a1这一步的动作价值。原创 2022-09-08 21:20:59 · 1047 阅读 · 2 评论 -
学习笔记-动态规划(基础)+例题
目录一、动态规划题型1.计数问题3.求存在性二、动态规划的组成部分☆以一道题为例:小结一、动态规划题型1.计数问题-有多少种方式走到右下角-有多少种方法选出k个数使得和为sumhttps://leetcode-cn.com/problems/unique-paths/2.求最大最小值-从左上角走到右下角路径的最大数字和-最长上升子序列长度https://leetcode-cn.com/problems/maximum-product-s原创 2022-02-09 23:07:55 · 447 阅读 · 1 评论 -
python刷题--N数之和问题(双指针+剪枝)
1.两数之和(双指针)这题前面已经做过,当时是用哈希表做的,时间复杂度为N但如果换一种思路,用今天学的双指针来做,虽然在时间复杂度上不降反增(排序的复杂度为NlogN)但理解起来十分简单清晰。思路:即先排序,得到一个有序的列表,一个指针指向列表开头,一个指向末尾。...原创 2022-02-03 23:22:44 · 1667 阅读 · 0 评论 -
学习笔记-字典小tip
a = [1, 2, 3, 4, 5]b = ['b'+str(i) for i in range(1, len(a)+1)]c = dict(zip(b, a)) # 字典可以接收元组自动形成键值对for i in zip(b, a): print(i)print(c)for k, v in c.items(): print(f'{k} = {v}') # 固定用法 和下面的输出一样 # print("{} = {}".format(k, v))d = dict(.原创 2022-01-24 17:32:33 · 513 阅读 · 0 评论
分享