pandas库中空值替换和排序
#替换处理缺失值(NaN,None)
df.fillna('banana',inplace=True)
#在price这一列中哪一行有空值就删除整行
df=df.dropna(subset=['price'])
#排序 大->小 小->大 by='想要排序的列'
df.sort_values(by='state',ascending=False)
df.sort_values(ascending=True)
计算
#相乘
#把quantity列和item_price列相乘放到he列
df['he']=df['quantity']*df['item_price']
#计算平均值 mean(1)计算行平均(默认计算列平均) 给平均值指定2位小数
df.mean(1).round(2)
列字符串切片
#切除掉item_price列所有第一个字符
df['item_price'].str[1:]
挑选指定行,做运算
# df[df['title'] == 'sing']:
# 这部分代码是在数据框df中筛选出title列等于‘sing’的行。它返回一个新的数据框,其中只包含与指定的东西匹配的记录。
# ['price']和['sales_num']:
# 在筛选后的新数据框中,分别选取price列和sales_num列。
lsum=(df[df['title']=='sing']['price']*df[df['title']=='sing']['sales_num']).sum()
#把title列中所有等于‘sing’的行找出来,取出这一行对应的price列的值,也取出salesnum列对应的值,相乘在求总和