十、Categorical
1、从 0.15 版本开始,pandas 可以在 DataFrame 中支持 Categorical 类型的数据。

2、将 Categorical 类型数据重命名为更有意义的名称:

3、对类别进行重新排序,增加缺失的类别:

line 131 对 上上图的类别进行了重新排序,并增加了缺失的类别。
4、排序是按照Categorical 的顺序进行的而不是按照字典顺序进行,即按照Categorical定义的顺序排列:

5、对Categorical列进行排序时存在空的类别:

十一、画图


对于 DataFrame 来说, plot 是一种将所有列及其标签进行绘制的简便方法:

plt.lenend(loc = 'best')将图例摆放至最佳位置。

十二、导入和保存数据
CSV
1、 写入CSV文件:

2、从csv文件中读取:

EXCEL
1、写入EXCEL文件:

2、从EXCEL文件中读取:

HDF5
HDF5 是一种常见的跨平台数据储存文件,可以存储不同类型的图像和数码数据,并且可以在不同类型的机器上传输,同时还有统一处理这种文件格式的函数库。
1、写入HDF5存储:

2、从HDF5存储中读取:

如果你尝试某个操作并且看到如下异常:

上图说明用Series做条件判断时,值不确定,应用a.empty, a.any()或a.all() 。
本文介绍了Pandas库在0.15版本后对Categorical类型的支持,包括数据重命名、排序、添加缺失类别,以及DataFrame的画图功能。此外,还详细讲解了CSV、Excel和HDF5文件的导入和保存操作,以及处理可能遇到的异常情况。

被折叠的 条评论
为什么被折叠?



