目录
1. 写在前面
主要是阶段性框架总结
1.1 AI 之路:
数据分析——机器学习——深度学习——CV/NLP
1.2 工具/技能:
Python、NumPy、Pandas、Matplotlib——Scikit-learn;LR、SVM…——TensorFlow、Keras、Pytorch;CNN、RNN…
2. 数据分析
使用 NumPy 或者 Pandas 进行数据分析,后者更为强大和专业,而且有自己的 Matplotlib 的接口可用于可视化。
2.1 数据分析的流程
- 提出问题
- 理解数据
- 数据清洗
- 构建模型
- 数据可视化
2.2 数据的基本操作方法
以Pandas操作二维以上的数据为例 ,总结操作数据的一些方法。
2.2.1 Pandas 概览
- Pandas 的方法链:
绝大数的 Pandas 方法都是返回一个 DataFrame 对象,以便被后续的 Pandas 方法进行使用。 - 创建 DataFrame :
传入字典生成:给定每列的值
传入数组生成:给定每行的值
2.2.2 使用Pandas 操作数据的核心
那么多操作(数据)的方法,总结起来其实就两步:
先选择数据,再进行函数操作。