本节介绍了scikit-learn相关开发环境的搭建步骤。这里主要用到IPython、Numpy、Pandas、Matplotlib和scikit-learn等软件包。
搭建Python开发环境一般有两种常用的方式:
(1)安装Anaconda集成环境
Anaconda是一个开源的Python发行版本,其包含了conda、python、ipython、numpy、scipy、pandas、matplotlib和scikit-learn等180多个常用的科学计算包及其依赖项。由于包含了大量的python包,Anaconda的下载文件比较大,如果只需要其中某些包,或者为了节省带宽或存储空间,也可以使用Miniconda这个较小的发行版(仅包含conda和 Python)。使用Anaconda可以很容易地将多套Python开发环境(如Python2和Python3)完全隔离开来,使用conda命令来切换需要的开发环境。
关于Anaconda的安装和使用,可以参考下面这两篇教程,感谢原创。
(2)单独安装需要的软件包
如果不想安装Anaconda环境,也可以直接使用pip命令单独安装需要的软件包:
# pip install jupyter numpy matplotlib scipy pandas scikit-learn seaborn
安装完成后,可以在终端输入ipython命令启动IPython,并检查每个工具包的版本号:
]# ipython
Python 3.7.1 (default, Dec 14 2018, 19:28:38)
Type