- 博客(1)
- 收藏
- 关注
转载 ql
import numpy as np Q 矩阵初始化为0 q = np.matrix(np.zeros([6, 6])) Reward 矩阵为提前定义好的。 类似与HMM的生成矩阵。-1表示无相连接的边 r = np.matrix([[-1, -1, -1, -1, 0, -1], [-1, -1, -1, 0, -1, 100], [-1, -1, -1, 0, -1, -1], [-...
2018-12-10 22:35:55
521
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人