- 博客(26)
- 收藏
- 关注
原创 强化学习-第三章-表格型方法
方差越来越大:它这里的第n步不是指更新了n次,而指的是,从现在这个(s,a)开始,往后取n个(r,s,a)数值对,用那n个的(r,s,a)数值对更新现在这个(s,a)的价值,n取得越大,越接近于monte carlo法。monte carlo法是一种无偏估计,也就是它是正儿八经去采样了,去执行了后面的状态和动作,用这些执行后的结果来更新,这些结果是真实数据,没有利用统计方法或其他方法进行数值平滑化,因此无偏估计的方差,相比起加入了数学方法的有偏估计的方差,会大一点。
2025-08-30 08:33:49
811
原创 Ubuntu20.04安装
Windows 和 Ubuntu 双系统的安装和卸载_哔哩哔哩_bilibili【ubuntu20.04】10分钟win10安装ubuntu20.04双系统(无需Bios设置)_哔哩哔哩_bilibili
2024-09-20 13:58:51
344
原创 Carsim2018入门第一步—新建数据库datebase
本人小白初学Carsim,记录自己学习历程也和大家分享在操作过程中遇到的问题和解决方法。一、新建数据库datebase1.新建.cpar 点击Tools下的Library Tools在左侧选择需要的Categories,就会在右侧栏出现在Datebases中,点击datasets的文件,会进入到下方Selected Datebases,然后点击 Export to Consoildated Parsfile就会创建一个新的.cpar(这里注意:如果只选择其中一个Categor...
2021-09-22 18:18:08
7335
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅