【Python_042】Pandas数据处理

来源 和鲸社区 和鲸训练营 第二期
第一期笔记见Pandas基础 | 实战

import pandas as pd
import numpy as np

# 1.读取本地EXCEL数据
df = pd.read_excel(r"E:\pandas120.xlsx")

# 2.查看df数据前5行
df.head()
'''
createTime	education	salary
0	2020-03-16 11:30:18	本科	20k-35k
1	2020-03-16 10:58:48	本科	20k-40k
2	2020-03-16 10:46:39	不限	20k-35k
3	2020-03-16 10:45:44	本科	13k-20k
4	2020-03-16 10:20:41	本科	10k-20k
'''

# 3.将salary列数据转换为最大值与最小值的平均值
df['salary'] = df['salary'].apply(lambda x: (int(str(x).replace('k','').split('-')[0]) + int(str(x).replace('k','').split('-')[1]))/2*1000)

# 4.将数据根据学历进行分组并计算平均薪资
df.groupby(['education'])['salary'].mean().reset_index().sort_values(
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值