数据分析-Pandas类别数据序列Union操作
数据分析和处理中,难免会遇到各种数据,那么数据呈现怎样的规律呢?不管金融数据,风控数据,营销数据等等,莫不如此。如何通过图示展示数据的规律?
数据表,时间序列数据在数据分析建模中很常见,例如天气预报,空气状态监测,股票交易等金融场景。数据分析过程中重新调整,重塑数据表是很重要的技巧,此处选择Titanic数据,以及巴黎、伦敦欧洲城市空气质量监测 N O 2 NO_2 NO2数据作为样例。
数据分析
实验数据分析处理,股票序列,时间序列,信号序列,有时候表格的数据并不完全是数值类型,也有可能是字符串,或者其他数据,需要做分类处理。pandas如何控制数据分类处理呢?需要配置哪些参数?
类型的Union联合
如果要合并不一定相同类别的两个分类数据,函数union_categoricals 将列表部分合并,重新组合两者类别列表。
In [1]: from pandas.api.types import union_categoricals
In [2]: a = pd.Categorical(["b", "c"])
In [3]: b = pd.Categorical(["a", "b"])
In [5]: union_categoricals([a, b])
Out[5]:
['b', 'c', 'a', 'b']
Categories (3, object): ['b', 'c', 'a']
默认情况下,重组生成的类别将按它们出现的先后顺序排序,如果你希望类别是词法重新排序,可以使用参数: sort_categories=True
In [6]: union_categoricals([a, b], sort_categories=True)
Out[6]:
['b', 'c', 'a', 'b']
Categories (3,