
Python
辉哥的博客
这个作者很懒,什么都没留下…
展开
-
Python报错总结
Python报错总结原创 2022-08-24 14:15:31 · 420 阅读 · 1 评论 -
Python使用pandas_profiling库生成报告
Python使用pandas_profiling库生成报告Python安装pandas_profiling命令行安装pip install pandas_profilingpip install pandas_profiling==2.10.1 --指定版本清华镜像安装pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas_profiling卸载pandas_profilingpip uninstall pa原创 2022-01-27 15:46:51 · 3388 阅读 · 0 评论 -
Python读取csv文件添加后缀以及新增一列
Python读取csv文件添加后缀以及新增一列需求:生成测试"image"csv文件;"image"列添加后缀;添加"name"列;#Python代码如下:import pandas as pd#1.生成测试文件image = [1,2,3,4,5]df = pd.DataFrame({'image':image})df.to_csv("../test_data/image.csv",index=False)#2.读取测试文件df = pd.read_csv('../原创 2022-01-16 18:32:33 · 2529 阅读 · 0 评论 -
Excel 文件合并
Excel 文件合并实现多个Excel文件合并,列名必须一致import pandas as pdimport osbase_dire = './data'result_file = './result/merge.xlsx'#os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。excels = [pd.read_excel(os.path.join(base_dire,fname)) for fname in os.listdir(base_dire) if原创 2021-09-30 15:19:22 · 143 阅读 · 0 评论 -
Python实现单个Sheet文件合并
Python实现文件合并需求:一个文件夹下面包含多个子文件夹,子文件夹里面还有多个Excel文件,取出指定的列,将所有文件合并成1个Excel文件,如下图。代码如下# -*-coding:utf-8-*-#处理文件路径import os#Pandas 是 Python 语言的一个扩展程序库,用于数据分析。import pandas as pd#定义变量base_dire = "./data/CHD提取信息"g = os.walk(base_dire)result_file = '原创 2021-09-23 18:19:19 · 298 阅读 · 0 评论 -
Python实现多个Sheet文件合并
Python实现多个Sheet文件合并**需求:1个文件下面有多个子文件夹,子文件夹下面有很多个Excel文件,每个Excel里面有多个sheet_name,根据sheet_name分别写到对应的csv文件。**import osimport pandas as pdbase_dire = "./data/xxxxxxx,xx0001-03078"result_file = './result/'#遍历文件夹下所有文件及目录for path,dir_list,file_list in原创 2021-09-29 16:29:55 · 1313 阅读 · 0 评论 -
Python实现多个Sheet文件合并,添加列
Python实现多个Sheet文件合并,添加列需求:除了患者信息表,其它表添加patient_id字段;代码如下import osimport pandas as pd'''需求:除了患者信息表,其它表添加patient_id字段;'''base_dire = "./data/xxxx"result_file = './result/'for path,dir_list,file_list in os.walk(base_dire): for file_name in fil原创 2021-09-29 17:31:41 · 3491 阅读 · 0 评论 -
Python实现分组排序
Python实现分组排序需求1:按照药品名称(ADVICE_CONTENT)分组,排序。第一种实现方式import pandas as pdbase_dire = './result/xx.csv'result_file = './result/drug_group_desc.csv'df = pd.read_csv(base_dire,engine='python',encoding='utf-8',usecols=['ADVICE_CONTENT'])#第一种方式使用size函数添加原创 2021-09-29 18:05:04 · 4288 阅读 · 0 评论 -
Python实现多个Sheet文件合并(传参)
Python实现多个Sheet文件合并(传参)用法:传入需要遍历的来源目录路径和结果文件路径import osimport pandas as pdclass Data_Merge: def __init__(self,source_dire,result_file): self.source_dire=source_dire self.result_file=result_file def table_merge(self):原创 2021-09-30 14:54:34 · 300 阅读 · 0 评论 -
Python处理诊断编码数据
Python处理诊断编码数据需求:一个诊断名称对应多个诊断编码,取出现次数最多的那一个。import pandas as pddf=pd.DataFrame([['糖尿病','1'],['糖尿病','2'],['糖尿病','3'],['糖尿病','1'],['糖尿病',''],['糖尿病',''], ['高血压','1'],['高血压','2'],['高血压','3'],['高血压','1'],['高血压',''],['高血压','']原创 2021-09-30 16:06:45 · 468 阅读 · 0 评论