数据准备
replace()函数

两种等价的写法

重命名轴索引
- reindex() 只能对已有的标签名进行排列和增加新的标签名,并且不会影响源数据。

使用以上方法会对原始数据进行修改,如果不想修改原始数据,需要使用rename()方法

还可以通过rename()方法,使用键值对修改索引

面元划分
需要创建面元bin,然后使用cut()方法,传入要划分的列表和面元bin


可以再划分的时候设置 right = False 参数来设置左闭右开

也可以指定划分的阶段:

qcut()
使用pd.qcut()可以等数量划分
如果传入列表,则根据列表区间占比进行数量划分
取出任一行包含大于三的数据
data[(np.abs(data)>3).any(1)]
打乱排序方法
random下的permutation方法


take()函数
使用take()函数,提取数组

也可以使用sample()方法随机选取几行



被折叠的 条评论
为什么被折叠?



