- 博客(62)
- 收藏
- 关注
原创 [原创]从model-based推导到model-free(到PG+general advantage estimation)
总结来说,价值迭代是在迭代迭代最优价值函数的时候就对所有的动作轨迹进行尝试,直接找到最准确的对于当前状态的最优价值函数。而策略迭代则是每一次用不太准确的最优价值函数去更新策略,一步一步的逼近真正的最优价值函数,从而得到最优策略。两者并没有本质的区别。关于q-learning比较有经典且代表性的算法就是DDQN。DDQN主要是学习一个Q网络,它的输入是当前状态和动作输出是从当前状态开始,采取动作a之后的每一步都是optimal action的情况下所获得的折扣回报的期望,这个也是q-value的意义。
2023-08-07 23:26:21
471
原创 [原创]常用的tmux命令汇总
tmux是一个强大的终端复用器,与screen类似,但提供了更多的功能和更好的用户体验。在tmux会话中,按下Ctrl-b,然后按c。这将在当前会话中创建一个新窗口。按下Ctrl-b,然后按d。这将分离当前会话,但会话仍在后台运行。按下Ctrl-b,然后按方向键(如上、下、左、右)。按下Ctrl-b,然后按n切换到下一个窗口。按下Ctrl-b,然后按p切换到上一个窗口。按下Ctrl-b,然后按%进行垂直分割。按下Ctrl-b,然后按"进行水平分割。按下Ctrl-b,然后按x。
2023-08-06 19:53:14
782
原创 # 算法训练营第十期总结篇
一刷,总体过了一遍题型,熟悉了二叉树,回溯和动归这些经典算法的套路,后面几天因为考试所以刷的不是很熟练,之后考完试再捡一下,总体感觉难度还可以。
2023-04-30 10:36:50
151
原创 代码随想录算法训练营第60天 | (考试周)动态规划 LeetCode84.柱状图中最大的矩形
代码随想录算法训练营第60天 | (考试周)动态规划 LeetCode84.柱状图中最大的矩形。
2023-04-29 13:32:13
123
原创 代码随想录算法训练营第59天 | (考试周)动态规划 LeetCode503.下一个更大元素II ,42. 接雨水
代码随想录算法训练营第59天 | (考试周)动态规划 LeetCode503.下一个更大元素II ,42. 接雨水。
2023-04-29 13:30:19
235
原创 代码随想录算法训练营第58天 | (考试周)动态规划 LeetCode739. 每日温度,496.下一个更大元素 I
代码随想录算法训练营第58天 | (考试周)动态规划 LeetCode739. 每日温度,496.下一个更大元素 I。
2023-04-29 13:27:44
121
原创 代码随想录算法训练营第57天 | (考试周)动态规划 LeetCode647. 回文子串,516.最长回文子序列
代码随想录算法训练营第57天 | (考试周)动态规划 LeetCode647. 回文子串。
2023-04-25 16:23:35
176
原创 代码随想录算法训练营第56天 | (考试周)动态规划 LeetCode583. 两个字符串的删除操作,72. 编辑距离
代码随想录算法训练营第56天 | (考试周)动态规划 LeetCode583. 两个字符串的删除操作,72. 编辑距离。
2023-04-25 16:18:04
112
原创 代码随想录算法训练营第55天(54周日休息) | (考试周)动态规划 LeetCode392.判断子序列,115.不同的子序列,583. 两个字符串的删除操作
代码随想录算法训练营第55天(54周日休息) | (考试周)动态规划 LeetCode392.判断子序列,115.不同的子序列,583. 两个字符串的删除操作。
2023-04-22 11:09:16
67
原创 代码随想录算法训练营第53天 | (考试周)动态规划 LeetCode1143.最长公共子序列,1035.不相交的线,53. 最大子序和 动态规划
代码随想录算法训练营第53天 | (考试周)动态规划 LeetCode1143.最长公共子序列,1035.不相交的线,53. 最大子序和 动态规划。
2023-04-22 11:01:58
95
原创 代码随想录算法训练营第52天 | 动态规划 LeetCode300.最长递增子序列,674. 最长连续递增序列,718. 最长重复子数组
代码随想录算法训练营第52天 | (考试周)动态规划 LeetCode300.最长递增子序列,674. 最长连续递增序列,718. 最长重复子数组。
2023-04-22 10:55:52
117
原创 代码随想录算法训练营第51天 | 动态规划 LeetCode309.最佳买卖股票时机含冷冻期,714.买卖股票的最佳时机含手续费
代码随想录算法训练营第51天 | 动态规划 LeetCode309.最佳买卖股票时机含冷冻期,714.买卖股票的最佳时机含手续费。
2023-04-21 13:39:10
95
原创 代码随想录算法训练营第50天 | 动态规划 LeetCode123.买卖股票的最佳时机III,188.买卖股票的最佳时机IV
代码随想录算法训练营第50天 | 动态规划 LeetCode123.买卖股票的最佳时机III,188.买卖股票的最佳时机IV。
2023-04-19 12:29:37
86
原创 代码随想录算法训练营第49天 | 动态规划 LeetCode121. 买卖股票的最佳时机,122.买卖股票的最佳时机II
代码随想录算法训练营第49天 | 动态规划 LeetCode121. 买卖股票的最佳时机,122.买卖股票的最佳时机II。
2023-04-18 19:23:16
123
原创 代码随想录算法训练营第48天 | 动态规划 LeetCode198.打家劫舍,213.打家劫舍II,337.打家劫舍 III
代码随想录算法训练营第48天 | 动态规划 LeetCode198.打家劫舍,213.打家劫舍II,337.打家劫舍 III。
2023-04-17 11:40:13
182
原创 代码随想录算法训练营第46天 | 动态规划 完全背包 LeetCode139.单词拆分, 多重背包理论
@代码随想录算法训练营第46天 | 动态规划 完全背包 LeetCode139.单词拆分, 多重背包理论没想法。回溯和动规都可以做,但是回溯会超时,需要一个memory去进行剪枝。动规的话就是dp数组表示s[0]到s[j]这个字符串可以被拆分,它为true的条件显然是用一个i遍历0-j,然后dp[i]为true的同时i-j这个字符串也能在wordset里找到。注意这个必须先遍历背包再遍历物品,因为必须是有序的排列多重背包当作01背包来做
2023-04-16 11:14:07
171
原创 代码随想录算法训练营第45天 | 动态规划 完全背包 LeetCode70. 爬楼梯 (进阶),322. 零钱兑换,279.完全平方数
代码随想录算法训练营第45天 | 动态规划 完全背包 LeetCode70. 爬楼梯 (进阶),322. 零钱兑换,279.完全平方数。
2023-04-14 19:57:07
362
原创 代码随想录算法训练营第44天 | 动态规划 完全背包 LeetCode 518. 零钱兑换 II,377. 组合总和 Ⅳ
@代码随想录算法训练营第44天 | 动态规划 完全背包 LeetCode518. 零钱兑换 II,377. 组合总和 Ⅳ完全背包完全背包和01背包问题唯一不同的地方就是,每种物品有无限件。解题上的不同之处只在于遍历顺序,01背包需要从后往前遍历dp数组,但是完全背包需要从前往后,因为一个物体可以被放无数次。518. 零钱兑换 II第一遍读题思考完全背包加组合背包,组合背包的递推公式加上完全背包的遍历顺序。代码随想录解法思路一样。c++代码具体实现注意事项class Solution {
2023-04-13 10:17:37
128
原创 代码随想录算法训练营第43天 | 动态规划 背包理论基础 LeetCode1049.最后一块石头的重量II,494.目标和,474.一和零
重点在于背包问题的理论基础建议阅读以下两个链接。背包问题理论基础,用二维数组入门背包问题理论基础,用一维数组优化。
2023-04-13 09:29:26
208
原创 代码随想录算法训练营第42天 | 动态规划 背包理论基础 LeetCode416. 分割等和子集
代码随想录算法训练营第42天 | 动态规划 背包理论基础 LeetCode416. 分割等和子集。
2023-04-11 08:45:50
170
原创 代码随想录算法训练营第41天(第40天周日休息) | 动态规划 LeetCode343.整数拆分,96.不同的二叉搜索树
代码随想录算法训练营第41天(第40天周日休息) | 动态规划 LeetCode343.整数拆分,96.不同的二叉搜索树。
2023-04-09 14:45:06
52
原创 代码随想录算法训练营第39天 | 动态规划 LeetCode62.不同路径,63. 不同路径 II
代码随想录算法训练营第39天 | 动态规划 LeetCode62.不同路径,63. 不同路径 II。
2023-04-08 15:44:10
302
原创 代码随想录算法训练营第38天 | 动态规划理论基础 LeetCode509. 斐波那契数,70. 爬楼梯,746. 使用最小花费爬楼梯
代码随想录算法训练营第38天 | 动态规划 LeetCode509. 斐波那契数,70. 爬楼梯,746. 使用最小花费爬楼梯。
2023-04-08 15:19:23
261
原创 代码随想录算法训练营第37天 | LeetCode738.单调递增的数字,968.监控二叉树
代码随想录算法训练营第37天 | LeetCode738.单调递增的数字,968.监控二叉树。
2023-04-06 14:49:46
226
原创 代码随想录算法训练营第36天 | LeetCode435. 无重叠区间,763.划分字母区间,56. 合并区间
代码随想录算法训练营第36天 | LeetCode435. 无重叠区间,763.划分字母区间,56. 合并区间。
2023-04-05 17:00:20
139
原创 代码随想录算法训练营第35天 | LeetCode860.柠檬水找零,406.根据身高重建队列,452. 用最少数量的箭引爆气球
代码随想录算法训练营第35天 | LeetCode860.柠檬水找零,406.根据身高重建队列,452. 用最少数量的箭引爆气球(学到了一些代码小知识)
2023-04-04 15:06:48
327
原创 代码随想录算法训练营第34天(第33天周日休息) | LeetCode1005.K次取反后最大化的数组和,134. 加油站,135. 分发糖果
代码随想录算法训练营第34天(第33天周日休息) | LeetCode1005.K次取反后最大化的数组和,134. 加油站,135. 分发糖果。
2023-04-03 20:59:57
41
原创 代码随想录算法训练营第32天 | LeetCode122.买卖股票的最佳时机II ,55. 跳跃游戏,45.跳跃游戏II
代码随想录算法训练营第32天 | LeetCode122.买卖股票的最佳时机II ,55. 跳跃游戏,45.跳跃游戏II。
2023-04-01 17:33:01
147
原创 代码随想录算法训练营第31天 | 贪心算法理论基础,LeetCode455.分发饼干,376. 摆动序列,53. 最大子序和
代码随想录算法训练营第31天 | 贪心算法理论基础,LeetCode455.分发饼干,376. 摆动序列,53. 最大子序和。
2023-04-01 14:44:56
94
原创 代码随想录算法训练营第30天 | LeetCode332.重新安排行程,51. N皇后,37. 解数独
代码随想录算法训练营第30天 | LeetCode332.重新安排行程,51. N皇后,37. 解数独。
2023-03-31 15:58:06
157
原创 代码随想录算法训练营第29天 | LeetCode491.递增子序列,46.全排列,47.全排列 II
代码随想录算法训练营第29天 | LeetCode491.递增子序列,46.全排列,47.全排列 II。
2023-03-29 16:16:52
89
原创 代码随想录算法训练营第28天 | LeetCode93.复原IP地址,78.子集,90.子集II
代码随想录算法训练营第28天 | LeetCode93.复原IP地址,78.子集,90.子集II。
2023-03-28 14:36:08
135
原创 代码随想录算法训练营第27天(第26天周日休息) | LeetCode39. 组合总和,40.组合总和II,131.分割回文串
代码随想录算法训练营第25天 | LeetCode39. 组合总和,40.组合总和II,131.分割回文串。
2023-03-27 13:50:13
119
原创 代码随想录算法训练营第25天 | LeetCode216.组合总和III,17.电话号码的字母组合
代码随想录算法训练营第25天 | LeetCode216.组合总和III,17.电话号码的字母组合。
2023-03-26 10:20:53
92
原创 代码随想录算法训练营第24天 | 回溯算法理论基础,LeetCode77. 组合
代码随想录算法训练营第24天 | 回溯算法理论基础,LeetCode77. 组合。
2023-03-24 14:38:01
185
原创 代码随想录算法训练营第23天 | LeetCode669. 修剪二叉搜索树,108.将有序数组转换为二叉搜索树,538.把二叉搜索树转换为累加树
借用一张小伙伴的图作为总结。
2023-03-23 14:47:20
220
原创 代码随想录算法训练营第22天 | LeetCode235. 二叉搜索树的最近公共祖先,701.二叉搜索树中的插入操作,450.删除二叉搜索树中的节点
代码随想录算法训练营第22天 | LeetCode235. 二叉搜索树的最近公共祖先,701.二叉搜索树中的插入操作,450.删除二叉搜索树中的节点。
2023-03-22 14:41:27
88
原创 (自用)[知识点学习]python中怎么调用c++编写的函数?
具体项目参考链接:https://github.com/Navy-RISE-Lab/ground-texture-slam这个文章是想弄清楚这个项目中的simple_example.py中的import ground-texture-slam是怎么实现的。
2023-03-22 11:08:14
55
使用python代码将.png格式存储的深度图和彩色图转换为彩色点云并存储到一个rosbag中,可以自定义存储的帧率
2023-03-28
rosbag中提取深度图和rgb图像,并将其转换为tum的格式
2023-03-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人