一、项目介绍
近些年来,随着人民生活的提升,人民群众对于医疗条件的选择尤为重视,为此,各个诊所、医院应运而生来保障人民的身体健康。
以下为某医院售药部分的售药记录情况,请根据该医院的售药记录数据,进行相关数据
处理,并提出问题,挖掘其中有价值的信息,为该医院的下一步营销进行指导。

先进行数据清洗:
(1)把列索引变为容易理解的索引值
(2)删掉有空值的数据
(3)将’销售数量’,‘应收金额’,'实收金额’数据类型转换为 int
(4)删除’销售数量’,‘应收金额’,'实收金额’中小于 0 的数据
(5)'成交时间’特征转标准时间格式:
再进行分析:
(1) 每个月的人流量?
(2)人均平均消费?
(3)使用最频繁的前十种药品?
(4)多少人办社保卡?
二、代码
import pandas as pd
# 加载数据
data = pd.read_excel('./某医院2018年数据.xlsx')
print('data:\n', data)
print('data的列索引:\n', data.columns)
# print('每一列的非空数据的数量:\n', data.count())
print('每一列含有缺失值的数量:\n', pd.isnull(data).sum())
# 先进行数据处理
# 先进行数据清洗:
# (1)把列索引变为容易理解的索引值
# 将 购药时间 ----> 成交时间
# 更改列索引
data.rename(columns={
'购药时间': '成交时间'}, inplace=True)
print('更改后的列索引:\n', data.columns)
# (2)删掉有空值的数据
# 删掉所有有空值的数据---->删除掉有空值的行
data.dropna(axis=0, how='any', inplace=

最低0.47元/天 解锁文章
1046





