简单的python文件练习1(批量分析表格:对文件夹中所有的表格进行操作并绘图)

该代码使用Python的pandas、os、matplotlib和numpy库处理多个Excel文件,统计18-30岁人群数量、各针次接种人数,并绘制2针与3针接种比例的饼图。每个文件的结果分别保存为新的Excel表格和JPEG图像。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、目标:对文件夹中所有的表格进行操作并绘图
我随机生成了一些关于医院接种某种疫苗的表格数据(取了一些很随便的文件名),并且对此进行分析
表格如下:
在这里插入图片描述
每张表格内容大致如下:
在这里插入图片描述实现:汇总所有表格的总人数,年龄在18-30的人数,对每张表格的打2针和3针的人数进行绘图等

二、此次操作主要用到pandas, os, matplotlib,numpy库
整体代码如下:

import pandas as pd
import os
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np


path = r'D:\python表格练习'
Filelist = []
fileall=[]
Age1830=0
finsh=0
three=0


for home, dirs, files in os.walk(path):
    for filename in files:
            fileall.append(os.path.join(home, filename))# 文件名列表,包含完整路径
            Filelist.append(filename) # # 文件名列表,只包含文件名


for i in range(0,len(Filelist)):
    sheet1= pd.read_excel(fileall[i])
   # print(fileall[i])
    data_age = sheet1[sheet1['年龄'] >= 18][sheet1[sheet1['年龄'] >= 18 ]['年龄'] < 30]#筛选年龄大于等于18且小于30的
    age_18_30=len(data_age)
    Age1830=age_18_30+Age1830
    data_2jizhen=sheet1[sheet1['共需打几针'] ==2]#筛选打针列
    data_3jizhen=sheet1[sheet1['共需打几针'] ==3]
    three=three+len(data_3jizhen)
    data_3yida=sheet1[sheet1['已打几针'] ==3]
    ydw=len(data_3yida)+len(data_2jizhen[data_2jizhen['打了几针']==2])
    finsh=finsh+ydw
    #print("年龄在18-30的人数:",age_18_30,'\n','打3针的人数:',len(data_3jizhen),'\n','打完的人数:',ydw)
    data_age.to_excel(str('D:\python生成表格\\'+Filelist[i]+'年龄18-30.xlsx'))
   
   
    plt.rcParams['font.family'] = 'SimHei'
    plt.rcParams['axes.unicode_minus'] = False
    # 中文乱码问题
    data1 = [len(data_2jizhen), len(data_3jizhen)]# 设置画布大小
    plt.pie(data1, labels=['打两针的人', '打三针的人'])
    plt.title("2针和3针比例" + str(i + 1))
    #plt.figure(figsize=(17, 9), dpi=80)
    plt.savefig(str('D:\python生成饼图\\'+Filelist[i]+'打针统计.jpg'), dpi=300)
    print("已完成表格数量:"+str(i+1))

print(" 年龄在18-30的总人数:",Age1830,'\n','打3针的总人数:',three,'\n','打完的总人数:',finsh)
print("程序完成")

生成的表格与对应饼图:
在这里插入图片描述

在这里插入图片描述
三、代码分段结构
1.导入所需的库

import pandas as pd
import os
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np

2.读取文件

for home, dirs, files in os.walk(path):
    for filename in files:
            fileall.append(os.path.join(home, filename))# 文件名列表,包含完整路径
            Filelist.append(filename) # # 文件名列表,只包含文件名

3.对读入的内容进行分析

for i in range(0,len(Filelist)):
    sheet1= pd.read_excel(fileall[i])
   # print(fileall[i])
    data_age = sheet1[sheet1['年龄'] >= 18][sheet1[sheet1['年龄'] >= 18 ]['年龄'] < 30]#筛选年龄大于等于18且小于30的
    age_18_30=len(data_age)
    Age1830=age_18_30+Age1830
    data_2jizhen=sheet1[sheet1['共需打几针'] ==2]#筛选打针列
    data_3jizhen=sheet1[sheet1['共需打几针'] ==3]
    three=three+len(data_3jizhen)
    data_3yida=sheet1[sheet1['已打几针'] ==3]
    ydw=len(data_3yida)+len(data_2jizhen[data_2jizhen['打了几针']==2])
    finsh=finsh+ydw
    #print("年龄在18-30的人数:",age_18_30,'\n','打3针的人数:',len(data_3jizhen),'\n','打完的人数:',ydw)
    data_age.to_excel(str('D:\python生成表格\\'+Filelist[i]+'年龄18-30.xlsx'))
    

此处主要使用了pandas中读excel的库pd.read_excel

4.绘制饼图


    plt.rcParams['font.family'] = 'SimHei'
    plt.rcParams['axes.unicode_minus'] = False
    # 中文乱码问题
    data1 = [len(data_2jizhen), len(data_3jizhen)]# 设置画布大小
    plt.pie(data1, labels=['打两针的人', '打三针的人'])
    plt.title("2针和3针比例" + str(i + 1))
    #plt.figure(figsize=(17, 9), dpi=80)
    plt.savefig(str('D:\python生成饼图\\'+Filelist[i]+'打针统计.jpg'), dpi=300)
    print("已完成表格数量:"+str(i+1))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值