pandas中的Categorical类型
转换为categorical对象:
cate1为时间序列,其值为不是numpy数组,而是pandas.categorical对象,有categories和codes属性。
通过pd.Categorical()传入序列直接生成categorical对象:
通过from_codes函数构造:
ordered=True,将类别排序,亦可使用as_ordered()方法排序:
foo<bar表示foo的顺序在bar之前。
pandas中Series的分类方法
cat.codes:
cat.categories:
cat.set_categories():
remove_unused_categories:
方法 | 描述 |
---|---|
add_categories | 将新的类别(未使用过)添加到已有的类别的尾部 |
as_ordered | 使类别排序 |
as_unordered | 使类别无序 |
remove_unused_categories | 去除所有没有出现在数据中的类别 |
rename_categories | 使用新的类别名称替代现有的类别,不会改变类别的数量 |
set_categories | 指定一组新的类别替换现有类别,可以添加或删除类别 |
TimeGrouper
pipe方法
a=f(df,arg1=v1)
b=g(a,v2,arg3=v3)
c=h(b,arg4=v4)
在使用接受并返回Series或DataFrame对象的函数时,可以调用pipe方法;上述等价于以下:
c=df.pipe(f,arg1=v1).pipe(g,v2,arg3=v3).pipe(h,arg4=v4)