lc19837862-优快云博客

原创 pandas cut根据列值分组并且计算每组均值

待处理数据pd, 将处理结果输出到newpd。pd 包含m行，2列 #根据第0列分组，lables不加时显示具体的分组情况，这里是等分的。bin=10是10等分，也可以是具体的list表示分法，如bin = [1,2,3]。 pd['Categories'] = pd.cut(pd[0], 10, labels=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) pd['counts'] = pd.value_counts(pd.cut(pd[0], 10, labels

2020-10-10 19:56:47 2114

原创 pandas使用iloc选定行小结

iloc和loc的区别在于iloc只能用int取行，对于自定义index之后的数据处理比较方便。一般情况下，index a b0 x1 y11 x2 y22 x3 y33 x4 y4将column=“a” 设定为index并drop之后，a bx1 y1x2 y2x3 y3x4 y4想取x2到x4的行，先找到x2的index 和x4的index ，分别为

2020-10-07 23:09:35 1157 1

原创 pandas 将指定列和行作为index和columns

将指定行作为columns：#set 第0行作为column名。axis=1，列变换#有时候inplace=True的时候遇到了问题，这里inplace= False保留了第0行，然后drop掉第0行，比较安全。pd1=pd.set_axis(pd.iloc[0],axis=1,inplace= False) pd1=pd1.drop(index=0) #set “names列作为index名。这里直接drop了第0行，目前没有遇到过问题。pd=pd.set_index('names',dr

2020-10-07 00:16:49 14794

原创 pandas根据特定行的值筛选列

pandas删除特定行的值为nan的列假设要删除index=1的行中，列值为nan的列nacol = []#遍历这一列的columnsfor i in df.iloc[1].index.tolist():if GICS_ap.iloc[1][i] == ‘nan’:nacol.append(i)#nacol 包含了需要删除的列的列名。objective = df.drop(columns=nacol,axis=1)#objective 是剔除了nacol 列的结果。...

2020-10-06 17:39:07 1309 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人