【MIMIC数据库教程】六、使用Python读取MIMIC-IV3.1数据库:使用Python初探MIMIC-IV数据库和超大表格的读取

该文章已生成可运行项目,

【MIMIC数据库教程】六、使用Python读取MIMIC-IV3.1数据库:使用Python初探MIMIC-IV数据库和超大表格的读取

摘要: MIMIC-IV 是一个关系数据库,包含美国马萨诸塞州某三级学术医疗中心的住院患者数据。它继承 MIMIC-III 的基础,提供更丰富的数据,包括实验室测量、用药、生命体征记录等,支持医疗健康研究。但大量繁琐的表格极大地增加了数据处理的难度,本教程将详细介绍 MIMIC-IV 3.1 版本中包含的 31 张表格及其字段,帮助读者更好地理解和使用 MIMIC-IV 数据库。我将在本专栏中持续更新 MIMIC-IV 数据库的详细解读和数据挖掘,敬请关注!在本专栏前面的文章中,我们介绍了 MIMIC-IV 3.1 版本中包含的 31 张表格及其字段,但是在我本人的实际使用中,发现在UBUNTU环境下配置Postgresql数据库和Navicat连接数据库极为繁琐和困难,我在配置过程中遇到了很多问题,所以决定直接只用Python来读取MIMIC-IV3.1数据库,本文将详细介绍如何使用Python读取MIMIC-IV3.1数据库。


1.MIMIC-IV 3.1数据库大小初探

MIMIC-IV 3.1数据库中包括31张表格,其中Hosp模块中包含22张表格,ICU模块中包含9张表格,详细内容可参考本专栏前面的文章。在本文中,我们首先使用Python读取MIMIC-IV 3.1数据库,分别查看Hosp和ICU模块中各个表格的大小,以便了解各个表格中包含的数据量。

import os
import argparse
import matplotlib.pyplot as plt

def get_file_sizes(root_path, subfolders):
    """
    遍历指定根路径下的子文件夹,获取每个文件的大小并统一转换成GB。
    返回文件名和对应的文件大小列表。
    """
    file_sizes = {
   
   }
    for subfolder in subfolders:
        file_sizes[subfolder] = []
        folder_path = os.path.join(root_path, subfolder)
        if not os.path.exists(folder_path):
            print(f"文件夹 {
     
     folder_path} 不存在。")
            continue
        # 遍历文件夹中的文件
        for root, _, files in os.walk(folder_path):
            for file in files:
                file_path = os.path.join(root, file)
                # 尝试获取文件大小,并处理可能的权限错误
                try:
                    file_size = os.path.getsize(file_path)
                except PermissionError:
                    print(f"权限错误,无法访问文件: {
     
     file_path}")
                    continue
                # 转换文件大小统一为GB
                file_size_in_gb = file_size / 1e9  
本文章已经生成可运行项目
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值