数据分析-Pandas分类数据的比较如何避坑
数据分析和处理中,难免会遇到各种数据,那么数据呈现怎样的规律呢?不管金融数据,风控数据,营销数据等等,莫不如此。如何通过图示展示数据的规律?
数据表,时间序列数据在数据分析建模中很常见,例如天气预报,空气状态监测,股票交易等金融场景。数据分析过程中重新调整,重塑数据表是很重要的技巧,此处选择Titanic数据,以及巴黎、伦敦欧洲城市空气质量监测 N O 2 NO_2 NO2数据作为样例。
数据分析
本文用到的样例数据:
样例代码:
导入关键模块
import pandas as pd
import numpy as np
实验数据分析处理,股票序列,时间序列,信号序列,有时候表格的数据并不完全是数值类型,也有可能是字符串,或者其他数据,需要做分类处理。pandas如何控制数据分类处理呢?需要配置哪些参数?
分类数据的比较
有三种情况,可以将分类数据与其他对象进行比较:
- 与列表类的比较相等,例如相同长度的类似列表的对象(如列表、序列、数组…)。
- 分类数据之间的比较,它们对应数值是否相同,比较操作包括
==``!=``>``>=``<``<=
。 - 分类数据的所有数值与标量的比较。
所有其他的比较,尤其是两个类别的“不相等”比较,具有不同的 类别或具有任何类似列表的对象的分类将引发 错误.TypeError
In [112]: cat = pd.Series