强化学习:Q-learning与DQN(Deep Q Network)
文章目录Q-learningDQNexperience replayfix Q type
Q-learning是一种很常用的强化学习方法,DQN则是Q-learning和神经网络的结合。
Q-learning
首先要设计状态空间s,动作空间a,以及reward。
一次transition就是(s,a,w,s_)
一次episode就是
DQN
Q-learning如果状态很多,动作很多时,需要建立的q表也会十分的庞大,因此
神经网络就是用来算动作的q-value的
为了帮助收敛
experience
原创
2020-06-05 11:26:23 ·
9106 阅读 ·
1 评论