数据处理前:
import pandas as pd
io = '员工账号信息.xlsx'
data = pd.DataFrame(pd.read_excel(io,sheet_name = '已注册用户'))
#删除已离职
# .index获取行的行号
index_1 = data[data["工作状态"] == '已离职'].index
# print(index)
# 删掉对应的行号,0代表行,1代表列
data = data.drop(index_1, axis = 0)
#print(data)
#删除2000年之前数据所在行
#日期转换为datetime
data['录入日期'] = pd.to_datetime(data['录入日期'])
#获取年份小于2000所在索引
index_2 = data[data['录入日期'].dt.year < 2000].index
data = data.drop(index_2, axis= 0)
data.to_excel('./out/员工账号信息_清洗.xlsx',index=False)
数据处理后: