
机器学习
文章平均质量分 62
软件工程小施同学
区块链、DevOps、小程序、软件工程
展开
-
episode、epoch、batch-size、iteration区别
往往在agent训练完成后或经过一段时间训练后,进行很多次episode,检验agent执行任务的能力,可以通过评价指标、奖励值进行评估,对模型进行验证,并保存模型。,如果数据有300条,把数据分成了3个batch,batch_size是300 / 3 = 100,3个batch都跑完,即跑了三个iteration,就是一个epoch。假设把10000个样本,分成500批次送进去,则每次送进20个样本,则iteration=500,每经过一个iteration,参数更新一次。转载 2022-11-02 19:20:25 · 1628 阅读 · 0 评论 -
Q-learning学习笔记
原创 2017-11-21 21:58:53 · 689 阅读 · 0 评论