自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_39160779的博客

DKwtno 优快云认证博客专家优快云认证企业博客

码龄8年

29: 原创

7万+: 周排名

139万+: 总排名

12万+: 访问

: 等级

892: 积分

43: 粉丝

157: 获赞

25: 评论

553: 收藏

私信

关注

热门文章

分类专栏

最新评论

1.贝尔曼方程（Bellman equation）
百万光年: 推导函数那里写的稍微繁琐，可以这么理解： V_π(s_t)=E[G_t|S_t=s] =E[r_t+1 + γ G_t+1|S_t=s] =E[r_t+1|S_t=s] + γE[G_t+1|S_t=s] =E[r_t+1|S_t=s] + γV_π(s_t+1)
1.贝尔曼方程（Bellman equation）
m0_69388475: Bertsekas, D. P. (1976). Dynamic Programming and Stochastic Control. Academic Press, Inc bellman equation在书的第几章呀，求，书太厚了根本找不到
latex生成论文第一页空缺
xingS1992: 感谢作者解我疑惑
chi2test，matlab里的卡方检验
咕猫咛: 这个输出的p是看样本的卡方分布的相关性的吧？
ns3-dev报错：fatal error: numbers: No such file or directory
优快云-Ada助手: CS入门技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/gml?utm_source=AI_act_gml

深度强化学习

关注

文章平均质量分 60

关注数：文章数：11 文章阅读量：64713 文章收藏量：353

作者: DKwtno

努力是有瘾的(github同名)

展开