前言:这阵子突然对xgboost产生了极大的兴趣,参加过一些大数据比赛但也是停留在入门者瞎玩玩的级别,为了锻炼下自己也为了增加日后面试的谈资吧,来入门下当前很火的xgboost。网上有不少关于xgboost安装的教程和博客,可是因为一些用到的插件或者xgboost的版本不同等原因,初学者在安装的时候会遇到很多问题。以下就来记录下我安装的经验:
1、准备:
必要软件:
Python 2.7.x (64位)
Git 2.10.2 (64位)
MinGW 4.8.1 (64位)
fyi:上边提到的所有软件必须都是32位或者64位,否则会出现很多编译的错误导致无法生成文件。现在(2017.03.21)Git的最新版本去到了2.12.x,MinGW的最新版本去到了5.3.x,分别给出国外的下载地址(给方便下国外软件的朋友使用,本文不需要用到最新版的软件)。
Git:https://git-scm.com/;
MinGW:http://www.mingw.org/;
毕竟大部分要用到的软件插件什么的都是在github或者它们自己的官网上,国内可能下载比较困难,给出我用的下载地址。
下载地址:
Python:下载和安装百度就行了,很容易找到;
Git:http://download.youkuaiyun.com/detail/sqxing007/9672891?web=web (需要1个积分);
MinGW:http://download.youkuaiyun.com/download/liaoguol/7983413;
https://wang-shuo.github.io/2017/02/21/%E5%9C%A8Windows%E4%B8%8B%E5%AE%89%E8%A3%85XGBoost/;
2.64位win10下安装xgboost python包的教程
http://www.th7.cn/system/win/201603/157092.shtml;
2、软件的安装:
Git的安装:
git在xgboost安装中的作用不大,但是为了自动获取github上最新的xgboost包,还是安装一下,以后也会用到这个工具。
除了设置你所要安装的路径(我的路径是:E:\Git),中间的步骤基本只要下一步下一步就行了,傻瓜式的安装。
成功后,在cmd下输入git会出现git的帮助信息。
从下载地址下载的文件就是64位MinGW的压缩包,解压缩到需要放置的路径即可,也是很简单。
后续的make命令和运行库都在你所设置路径下的文件夹里(就是包含mingw32-make.exe这个程序的文件夹,我的路径是:E:\MinGW64\bin),然后你需要将这个路径添加入windows系统中的Path中。
完成上述步骤后,打开Git中的git-bash.exe,输入which mingw32-make,若显示这个文件的地址,那么安装就成功了。
3、XGBoost的安装、编译和Python模块的安装:
xgboost的安装需要用到git,在完成上述步骤中git的安装后,开始菜单或者你的右键会出现一个Git Bash,你也可以通过你的安装路径中的git-bash.exe打开,这是一个类似Windows cmd或者Linux cmd的命令行输入窗口。
在这个窗口里,使用cd命令进入到你想要保存xgboost代码的文件夹(我的路径是:E:\Algorithm),以我的例子就是:
然后输入以下代码即可下载xgboost资源文件:
完成后,在文件夹(我的路径是:E:\Algorithm\xgboost)里就会出现整个xgboost项目的资源文件。
xgboost的编译需要用到mingw,为了后续输入的方便,可以用两种方法简化mingw32-make命令为make:
1:将mingw安装路径下bin文件夹里(我的路径是:E:\MinGW64\bin)的mingw32-make.exe改名为make.exe;
2:使用Git Bash中的命令,将mingw32-make命令改写为make;
我们开始编译xgboost,首先需要在Git Bash中cd进入xgboost的文件夹(我的路径是:E:\Algorithm\xgboost):
我采用的是参考博客中,对xgboost分开编译的方法,每次编译一个子模块,为了避免整块编译时可能会出现的问题。在编译的时候可以观察那些相应的文件夹里会出现编译成功的文件:
完成最后一个命令,xgboost的编译就成功了。然后是安装xgboost的python模块,首先在Git Bash中cd进入xgboost文件夹里的python-package子文件夹(我的路径是:E:\Algorithm\xgboost\python-package),然后输入以下命令:
至此,已完成了xgboost的下载、编译和python模块的安装。Win+R,输入cmd运行windows命令行,输入python进入python编译环境,然后import xgboost,若没有报错,恭喜你,成功完成了xgboost的部署和实现。
在参考的文章里最后一部分还有使用xgboost的成功示例,读者也可以自己百度搜索一些xgboost的小例子进行实验。=)