一、模拟训练环境
上节课我们已经能够判断人物的钓鱼状态,接下来我们就需要对鱼儿上钩后的那个受力框进行DQN训练。
方案有两个:
使用卷积神经网络直接输入图像对网络进行训练。
使用普通网络,自己写代码模拟出图像中三个点的动态并把值给神经网络进行训练。
这里我们选用第二种。三个点的值为:移动框左箭头,移动框右箭头和指针。
上节课我们已经能够判断人物的钓鱼状态,接下来我们就需要对鱼儿上钩后的那个受力框进行DQN训练。
方案有两个:
使用卷积神经网络直接输入图像对网络进行训练。
使用普通网络,自己写代码模拟出图像中三个点的动态并把值给神经网络进行训练。
这里我们选用第二种。三个点的值为:移动框左箭头,移动框右箭头和指针。