Python的下载与安装
不同系统安装教程后面暂时没写,后面补上。
linux和MAC OS X自带了Python2.7.x,需另外安装最新版本。但是系统运行依赖于自带的Python2.7.x,因此请务必不要删除系统自带的版本。
Jupyter Notebook 的安装与使用方法
在linux下,运行如下命令
pip3 install jupyter
一些必需库的安装及功能简介
在linux系统或者MAC OS X,只需要在终端输入
sudo pip3 install numpy scipy matplotlib ipython pandas scikit-learn
-
Numpy——基础科学计算库
Numpy包含高维数组(array)计算、线性代数计算、傅里叶变换以及伪随机数等。Numpy对于scikit-learn来说至关重要,因为scikit-learn使用Numpy数组形式的数据来进行处理,所以我们需要吧数据都转化成Numpy数组的形式,而多维数组(n-dimensional array)也是Numpy的核心功能之一。
例:

-
Scipy——强大的科学计算工具集
Scipy是Python中用于进行科学计算的工具集,它有很多功能,如计算统计学分布、信号处理、计算线性代数方程等。scikit-learn需要使用Scipy来对算法进行执行,用的最多的就是Scipy中的sparse函数。sparse用来生成稀疏矩阵,而稀疏矩阵用来存储那些大部分数值为0的np数组,这种类型在scikit-learn的实际应用中非常常见。
例:

- pandas——数据分析的利器
pandas是一个Python中用于进行数据分析的库,它可以生成类似Excel表格式的数据表,而且可以对数据表进行修改操作。pandas还有个强大功能,它可以从很多不同种类的数据中提取数据,如SQL数据库、Excel表格甚至CSV文件。pandas还支持在不同列中不同类型的数据,如整数型、浮点型或字符串。
例:

从数据表中进行查询操作,例如把不在北京的同学信息显示出来,

- matplotlib——画出优美的图形
matplotlib是Python的绘图库,它以各种硬拷贝格式和跨平台的交互环境生成出版质量级别的图形,它能够输出的图形包括折线图、散点图、直方图等。
例:

注意:在代码中%matplotlib inline允许Jupyter Notebook进行内置实时绘图。如果不写这一行代码,则需要在最后加入plt.show()这一句,才能让图形显示出来。
scikit-learn——非常流行的Python机器学习库
scikit-learn是一个建立在Scipy基础上用于机器学习的Python模块。而在不同的应用领域中,已发展出为数众多的基于Scipy的工具包,它们被统一称为Scikits。而在所有的分支版本中,scikit-learn是最有名的。它是开源的,任何人都可以免费地使用它或者进行二次发行。
scikit-learn包含了众多顶级机器学习算法,它主要有六类的基本功能,分别是分类、回归、聚类、数据降维、模型选择和数据处理。

本文详细介绍Python环境下科学计算库的安装与使用,包括Numpy、Scipy、Matplotlib、Pandas和Scikit-learn。涵盖了从数据处理、数学运算到机器学习的全面指南。
5802

被折叠的 条评论
为什么被折叠?



