pandas之分类数据
1. category变量创建的四种方式
1-1. 创建Series时赋值类型
指定Series创建的dtype='category'
类别为pandas自动创建,不包含np.NA
1-2. 创建DataFrame时赋值某列的类型
1-3. 利用内置的Categorical创建,可以自定义类型
cat = pd.Categorical(['a','b','c','a'],categories=['a','b','c']) # categories可任意指定类型
pd.Series(cat) #创建Categorical变量,一定要转换为Series变量
1-4. 利用pd.cut函数创建
pd.cut(x,bins,right=True,labels)
##
x:待分割的列或者单维数组/列表
bins:分割点的合集,可为list,也可为IntervalIndex
right:分割区间是否包含右边界
labels:分割的每个区间对应的标签表