一、安装anaconda
anaconda里面预装了很多Python数据分析所需要的工具和库,很方便使用。同时利用anaconda的可以创建不同独立的Python环境,防止不同项目库之间的影响。
二、需要学习的Python库
1、Numpy
它是利用Python科学计算的基础包,功能主要包括:
(1)快速高效的多维数组对象naarray
(2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数
(3)用于读写硬盘上基于数组的数据集的工具
(4)线性代数运算、傅里叶变换,以及随机数生成
(5)用于将C、C++、Fortran代码集成到python的工具
2、Padndas
包含了高级的数据结构和操作工具,它们使得Python数据分析更加快速和容易。pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据(如SQL)灵活的数据处理能力。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。
3、Matplotlib
是最流行的用于绘制数据图表的python库
4、其他
Scipy、statsmodels、scikit-learn。
三、numpy
1、利用matplotlib的imshow画个图
import numpy as np
points = np.arange(-5, 5, 0.01)
xs, ys = np.meshgrid(points, points)
import matplotlib.pyplot as plt
z = np.sqrt(xs ** 2 + ys ** 2)
plt.imshow(z,cmap=plt.cm.gray)
plt.colorbar()
plt.title("zzzz")
来源自《利用Python进行数据分析》p101。
2、
五、参考
参考网址:https://www.cnblogs.com/wanghuaijun/p/7147570.html
书本:《利用Python进行数据分析》、《集体智慧编程》、《推荐系统实战》