课程概要
我们的数据分析要学习什么内容
数据分析
- 基础概念和环境
- matplotlib
帮助我们绘图
- numpy
帮助我们处理数值型的数组
- pandas
在nunpy的基础之上,除了能够帮助我们处理数值型的数据之外,还可以帮助我们处理字符串以及时间序列、列表、字典……几乎所有的数据类型都是可以通过pandas进行处理的
为什么要学习数据分析?
从数据角度来谈
- 从我们获得的数据中找一些有用的规律或者是价值以便我们后续去使用
- 我们通过某些来源(爬虫、购买……)获得的数据,这些数据我们将其存储在我们的数据库中,这个数据量是非常的大的(几万、几十万、几百万的都有),正常人是无法从这样庞大的数据中找出规律的
- 我们需要对这大量的数据进行统计和分析,之后,我们就可以从已有的数据中总结出我们感兴趣的规律,然后进行后续的使用
- 总结出来的规律往往会更加明显一些,我们可以通过一个图来将其可视化展示出来
- 进行数据分析能够非常方便地帮助我们从一堆数据中找一些非常直观的经验或者是结论供其他人或者是我们自己去使用
从个人角度来谈
- 有岗位需求
- 是Python数据科学的基础
- 是机器学习的基础
什么是数据分析?
数据分析是使用适当的方法对获取到的大量数据进行分析,帮助人们做出判断,以便采取适当行动。
数据分析的流程
- 提出问题
- 准备数据
- 分析数据
- 获得结论
- 成果可视化
- ……