- 【MIMIC数据库教程】一、MIMIC-IV3.1表格与字段详解(一):Hosp和ICU模块表格整体介绍
- 【MIMIC数据库教程】二、MIMIC-IV3.1表格与字段详解(二):Hosp住院模块表格详解(上)
- 【MIMIC数据库教程】三、MIMIC-IV3.1表格与字段详解(三):Hosp住院模块表格详解(中)
- 【MIMIC数据库教程】四、MIMIC-IV3.1表格与字段详解(四):Hosp住院模块表格详解(下)
- 【MIMIC数据库教程】五、MIMIC-IV3.1表格与字段详解(五):ICU模块表格详解
- 【MIMIC数据库教程】六、使用Python读取MIMIC-IV3.1数据库:使用Python初探MIMIC-IV数据库和超大表格的读取
【MIMIC数据库教程】六、使用Python读取MIMIC-IV3.1数据库:使用Python初探MIMIC-IV数据库和超大表格的读取
摘要: MIMIC-IV 是一个关系数据库,包含美国马萨诸塞州某三级学术医疗中心的住院患者数据。它继承 MIMIC-III 的基础,提供更丰富的数据,包括实验室测量、用药、生命体征记录等,支持医疗健康研究。但大量繁琐的表格极大地增加了数据处理的难度,本教程将详细介绍 MIMIC-IV 3.1 版本中包含的 31 张表格及其字段,帮助读者更好地理解和使用 MIMIC-IV 数据库。我将在本专栏中持续更新 MIMIC-IV 数据库的详细解读和数据挖掘,敬请关注!在本专栏前面的文章中,我们介绍了 MIMIC-IV 3.1 版本中包含的 31 张表格及其字段,但是在我本人的实际使用中,发现在UBUNTU环境下配置Postgresql数据库和Navicat连接数据库极为繁琐和困难,我在配置过程中遇到了很多问题,所以决定直接只用Python来读取MIMIC-IV3.1数据库,本文将详细介绍如何使用Python读取MIMIC-IV3.1数据库。
1.MIMIC-IV 3.1数据库大小初探
MIMIC-IV 3.1数据库中包括31张表格,其中Hosp模块中包含22张表格,ICU模块中包含9张表格,详细内容可参考本专栏前面的文章。在本文中,我们首先使用Python读取MIMIC-IV 3.1数据库,分别查看Hosp和ICU模块中各个表格的大小,以便了解各个表格中包含的数据量。
import os
import argparse
import matplotlib.pyplot as plt
def get_file_sizes(root_path, subfolders):
"""
遍历指定根路径下的子文件夹,获取每个文件的大小并统一转换成GB。
返回文件名和对应的文件大小列表。
"""
file_sizes = {
}
for subfolder in subfolders:
file_sizes[subfolder] = []
folder_path = os.path.join(root_path, subfolder)
if not os.path.exists(folder_path):
print(f"文件夹 {
folder_path} 不存在。")
continue
# 遍历文件夹中的文件
for root, _, files in os.walk(folder_path):
for file in files:
file_path = os.path.join(root, file)
# 尝试获取文件大小,并处理可能的权限错误
try:
file_size = os.path.getsize(file_path)
except PermissionError:
print(f"权限错误,无法访问文件: {
file_path}")
continue
# 转换文件大小统一为GB
file_size_in_gb = file_size / 1e9

最低0.47元/天 解锁文章
2643

被折叠的 条评论
为什么被折叠?



