从零开始的可视化编写---药品销售数据可视化
前言
我们本次所使用的软件及其版本
| 软件 / 库 | 版本 |
|---|---|
| Pycharm社区版 | 2021.3.3 |
| Python | 3.8 |
| Pandas | 1.4.1 |
| Numpy | 1.22.3 |
| PyMySQL | 1.0.2 |
| Flask | 2.0.3 |
| SQLALchemy | 1.4.32 |
项目的搭建
首先我们先搭建一个Flask项目,由于我们使用的是Pycharm社区版,所以我们是没法直接构建一个Flask项目的,所以我们可以先创建一个Python项目,然后自己不全配置,将他变成一个Flask项目。

创建完成后,我们在Python项目目录下创建两个文件夹static和temoplates,这两个文件夹的作用分别是存储静态文件和网页文件的,创建好的结构如下所示:

现在我们需要导入自己所需要的库

然后找到自己所需要的库下载即可

若觉得下载的速度太慢,可以使用清华源来下载
清华源:https://pypi.tuna.tsinghua.edu.cn/simple/

数据的查看与分析处理
数据的分析和读取
部分数据展示

这些字段的含义分别是:购药时间、社保卡号、商品编码、商品名称、销售数量、应收金额、实收金额
首先我们连接数据库来查看数据
import pandas as pd
from sqlalchemy import create_engine
# 自定义函数连接数据库获取数据
def connFun():
engine = create_engine("mysql+pymysql://root:123456@localhost:3306/flask")
sql = '''select * from medicinal'''
data = pd.read_sql(sql, engine)
return data
# 自定义函数求各城市的平均间夜数
value = connFun()
print(value)

可见已经可以读取到数据了
数据的清洗
首先我们来查看是否存在空的数据
null_data = value[value.isnull().T.any()]

我们假设将时间为空的数据直接删除,将社保卡号为空的数据填充000
value = value.dropna(subset=['time'])
value['insureID'].fillna('0000', inplace=True)
null_data = value[value.isnull().T.any()]

将销售额转换成INT类型
value['sales'] = value['sales'].astype(int)

最低0.47元/天 解锁文章
566

被折叠的 条评论
为什么被折叠?



