Numpy
- 随机选择list元素
ACTIONS = ['left', 'right']
action_name = np.random.choice(ACTIONS)
- 产生【0,1】均匀分布的随机数
np.random.uniform()
Panda
- panda初始化
table = pd.DataFrame(
np.zeros((n_states, len(actions))), # q_table initial values
columns=actions, # actions's name
)
pd.DataFrame(columns=self.actions, dtype=np.float64) # 建一个空的table
- 元素值读取
state_actions = q_table.loc[state, action] # 获取1个位置的元素值
state_actions = q_table.loc[state, :] # 获取第i行元素
q_table.loc[S_, :].max() # 获取第i行元素的最大值
- 判断是否元素值全为0
state_actions.all() == 0