【数据分析】Python处理excel之“数值替换”与“数值排序”

import pandas as pd
df = pd.read_excel('../test1/lesson4.xlsx')
df

在这里插入图片描述

Section 1 数值替换

# 一对一替换
# 评论数34替换成13
df['评论数'] = df['评论数'].replace(34,13)    # 注意要重新赋值一下才生效
df

在这里插入图片描述

# 全局替换
# 将本表格内所有的13替换成40
df = df.replace(13,40)
df

在这里插入图片描述

# 多对一替换
df = df.replace([235, 356], 300)    # 将表格内所有235,356全部替换成300
df

在这里插入图片描述

# 多对多替换(字典)
df = df.replace({300:333, 7:17})    # 300替换成333,7替换成17
df

在这里插入图片描述

Section 2 数值排序

# 按照观看次数 升序 
df = df.sort_values(by = ["观看次数"] , ascending = True)
df

在这里插入图片描述

# 按照观看次数 降序
df = df.sort_values(by = ["观看次数"] , ascending = False)
df

在这里插入图片描述

# 将行索引为1的发布时间设为None
df.loc[ [1],["发布时间"] ] = None
df

在这里插入图片描述

# 按照发布时间从晚到早排序,空值排在最开始
df = df.sort_values(by = ["发布时间"] , ascending = False, na_position = "first")
df

在这里插入图片描述

# 按照发布时间从早到晚排序,空值排在最后
df = df.sort_values(by = ["发布时间"] , ascending = True, na_position = "last")
df

在这里插入图片描述

# 按照多列排序
# 按照顶踩比例降序,按照观看次数升序排列
df = df.sort_values(by = ["顶踩比例","观看次数"] , ascending = [False, True])
df

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值