- 博客(3)
- 收藏
- 关注
原创 强化学习入门(二):K臂老虎机问题(k-armed Bandit Problem)
考虑以下学习问题。你需要在k种不同的选项或动作中重复作出选择。在每次选择之后,你都会得到一个从一个平稳的概率分布中选择的数字奖励,这取决于你所选择的行动。目标是在一段时间内最大化预期的总奖励。在k臂赌博机问题中,每个动作都有一个预期或平均奖励,称之为动作的。我们用At表示在时间步长t上所选择的动作,用Rt表示所获得的奖励。
2023-09-26 15:58:56
739
原创 Tensorflow找不到GPU:tensorflow 2.11.0版本开始,在windows上不再支持GPU
Tensorflow从2.11.0版本开始,在native-windows上不再支持GPU。
2023-02-20 21:47:32
32093
45
原创 启动yarn时,resourcemanager启动失败
使用启动yarn后,再使用jps查看进程,发现只有Notemanager启动了,而resourcemanager没有启动。
2023-02-14 16:24:13
6349
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人