背景
机器视觉应用之一:强化学习。
在监督学习任务中,我们都是给定样本一个固定标签,然后去训练模型,可是,在真实环境中,我们很难给出所有样本的标签,这时候,强化学习就派上了用场。简单来说,我们给定一些奖励或惩罚,强化学习就是让模型自己去试错,模型自己去优化怎么才能得到更多的分数。2016年大火的AlphaGo就是利用了强化学习去训练,它在不断的自我试错和博弈中掌握了最优的策略。本文采用深度学习的方式玩FlappyBird游戏。
安装过程:
0.安装Tensorflow:
这部分和之前一样,下载whl文件直接,install方式进行安装
1.安装OpenCV:
Download OpenCV 下载OpenCV
在opencv官网 http://opencv.org/ 右侧下载Linux版本的OpenCV
cd到下载目录
unzip opencv-2.4.13.zip
cd opencv-2.4.13
mkdir release
sudo apt-get install build-essential cmake libgtk2.0-dev pkg-config python-dev python-numpy libavcodec-dev libavformat-dev libswscale-dev
cd release
cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local ..
sudo make install
2.安装pygame:
sudo apt-get install python-pygame
之后,打开一个python 命令行,import pygame
看是否能够正常import进去。
3.下载FlappyBird:
Download DeepLearningFlappyBird 下载FlappyBird
git clone –recursive https://github.com/yenchenlin/DeepLearningFlappyBird
4.运行
在DeepLearningFlappyBird目录下运行:
python deep_q_network.py
画面不会卡顿,cpu版本会立刻出现结果。
运行结果如下: