强化学习,深度学习,深度强化学习
1.深度学习:任何通过神经网络的训练和学习都是深度学习
2.强化学习:基于MDP(马尔可夫决策过程),通过状态(state),决策(action),以及奖励(reward)和转化概率来进行学习的就是强化学习,通过求Q*(state,action),求pai*,复杂一点就可能不知道奖励和转化概率
3.深度强化学习:深度学习和强化学习的结合,就是通过定义一个函数Q(s,a)=w1*feature1
原创
2017-07-03 18:03:25 ·
2565 阅读 ·
0 评论