- 博客(4)
- 收藏
- 关注
原创 pandas cut根据列值分组并且计算每组均值
待处理数据pd, 将处理结果输出到newpd。pd 包含m行,2列 #根据第0列分组,lables不加时显示具体的分组情况,这里是等分的。bin=10是10等分,也可以是具体的list表示分法,如bin = [1,2,3]。 pd['Categories'] = pd.cut(pd[0], 10, labels=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) pd['counts'] = pd.value_counts(pd.cut(pd[0], 10, labels
2020-10-10 19:56:47
2081
原创 pandas使用iloc选定行小结
iloc和loc的区别在于iloc只能用int取行,对于自定义index之后的数据处理比较方便。一般情况下,index a b0 x1 y11 x2 y22 x3 y33 x4 y4将column=“a” 设定为index并drop之后,a bx1 y1x2 y2x3 y3x4 y4想取x2到x4的行,先找到x2的index 和x4的index ,分别为
2020-10-07 23:09:35
1131
1
原创 pandas 将指定列和行作为index和columns
将指定行作为columns:#set 第0行作为column名。axis=1,列变换#有时候inplace=True的时候遇到了问题,这里inplace= False保留了第0行,然后drop掉第0行,比较安全。pd1=pd.set_axis(pd.iloc[0],axis=1,inplace= False) pd1=pd1.drop(index=0) #set “names列作为index名。这里直接drop了第0行,目前没有遇到过问题。pd=pd.set_index('names',dr
2020-10-07 00:16:49
14723
原创 pandas根据特定行的值筛选列
pandas删除特定行的值为nan的列假设要删除index=1的行中,列值为nan的列nacol = []#遍历这一列的columnsfor i in df.iloc[1].index.tolist():if GICS_ap.iloc[1][i] == ‘nan’:nacol.append(i)#nacol 包含了需要删除的列的列名。objective = df.drop(columns=nacol,axis=1)#objective 是剔除了nacol 列的结果。...
2020-10-06 17:39:07
1295
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人