数据大清洗_Pandas库进阶(综合案例-医院数据统计)

一、项目介绍

近些年来,随着人民生活的提升,人民群众对于医疗条件的选择尤为重视,为此,各个诊所、医院应运而生来保障人民的身体健康。
以下为某医院售药部分的售药记录情况,请根据该医院的售药记录数据,进行相关数据
处理,并提出问题,挖掘其中有价值的信息,为该医院的下一步营销进行指导。

在这里插入图片描述

先进行数据清洗:
(1)把列索引变为容易理解的索引值

(2)删掉有空值的数据

(3)将’销售数量’,‘应收金额’,'实收金额’数据类型转换为 int

(4)删除’销售数量’,‘应收金额’,'实收金额’中小于 0 的数据

(5)'成交时间’特征转标准时间格式:

再进行分析:
(1) 每个月的人流量?
(2)人均平均消费?
(3)使用最频繁的前十种药品?
(4)多少人办社保卡?

二、代码

import pandas as pd

# 加载数据
data = pd.read_excel('./某医院2018年数据.xlsx')
print('data:\n', data)
print('data的列索引:\n', data.columns)
# print('每一列的非空数据的数量:\n', data.count())
print('每一列含有缺失值的数量:\n', pd.isnull(data).sum())

# 先进行数据处理
# 先进行数据清洗:
# (1)把列索引变为容易理解的索引值
# 将  购药时间 ----> 成交时间
# 更改列索引
data.rename(columns={
   
   '购药时间': '成交时间'}, inplace=True)
print('更改后的列索引:\n', data.columns)

# (2)删掉有空值的数据
# 删掉所有有空值的数据---->删除掉有空值的行
data.dropna(axis=0, how='any', inplace=
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值