MIMIC数据库简介

MIMIC是一个公开的重症监护病房患者数据集,包含了详细的医疗健康信息。本文介绍了MIMIC的三个版本,重点讲解了MIMIC-III v1.4,并宣布将开设专栏分享MIMIC数据库的知识和数据提取方法。

一 、MIMIC简介

MIMIC(Medical Information Mart for Intensive Care),是一个大型的公开数据库。该数据库记录了2001年至2019年期间贝斯以色列女狄肯斯医疗中心重症监护病房患者的相关数据,拥有4万多名患者的医疗健康数据和记录。

MIMIC数据库记录了人口统计学信息,如病人的性别、身高、宗教等情况。记录了实验室检验信息,如血常规,肝功能,肾功能等实验室检测数据。记录了患者的用药信息,如高血压患者服用了治疗高血压类药物等。记录了护理人员以及患者的护理级别等。记录了患者的检测成像报告,如胸X光片。记录了患者每次出入院信息,每次入院接受的单位以及主治医生、护士出具的护理记录和病例分析距离等海量数据。

二、版本介绍

MIMIC从开发至今,共存在三个大版本:MIMIC-II,MIMIC-III,MIMIC-IV。

  1. MIMIC-II
    MIMIC-II包含2001-2008年的数据。数据是主要从CareVue监视器收集的。MIMIC-II现在已不再公开,但如果想要提取数据,可以从MIMIC-III中获取数据,利用筛选数据库来源为CareVue来提取MIMIC-II的数据(对此有疑问的可以关注后续文章,会有说明)。

  2. MIMIC-III
    MIMIC-III包含2001-2012年的数据。患者数据是从Metavision和CareVue两个地方采集的。MIMIC-III 数据库当前最新版本是v1.4。这个版本是在2016年9月2日发布,此次发布提高了数据库中的数据质量,为Metavision数据库中的病人

<think>好的,我现在需要处理用户关于MIMIC数据库的查询。用户想了解如何下载、使用教程以及数据结构。首先,我需要回忆之前提供的引用内容,特别是引用[1]和引用[2]。引用[1]提到了Windows下的安装步骤,而引用[2]详细介绍了用Python读取MIMIC-IV的方法,包括分块读取和使用dask、spark等工具。 接下来,我需要整理这些信息,分点回答下载、教程和数据结构的问题。下载部分需要提到PhysioNet的认证流程,可能用户不知道需要完成培训,这点很重要。然后安装步骤可能需要指导用户如何解压和配置数据库,引用[1]可以作为参考。 使用教程方面,引用[2]提到了Python处理的方法,特别是pandas和dask的使用,还有未来的教程计划,这部分需要强调。数据结构部分需要说明MIMIC-IV的模块,比如hosp、icu等,可能用户不清楚这些模块的具体内容,需要简要说明。 另外,用户可能需要知道如何开始使用,比如从哪些表入手,比如patients、admissions,这些是基础表。同时,处理大型数据集的技巧也很重要,比如分块读取,引用[2]中的方法可以引用。 最后,生成相关问题时要覆盖安装、数据访问、处理技巧和应用场景,这样用户可以有进一步的问题方向。需要确保所有LaTeX格式正确,比如变量用$...$,但可能这里数学公式不多,主要注意代码块的使用。回答要结构清晰,分步骤说明,保持自然的中文表达,同时正确添加引用标识。</think>### MIMIC数据库的下载、使用与数据结构详解 #### 一、MIMIC数据库下载 1. **访问权限申请** MIMIC数据库需通过PhysioNet平台申请,需完成CITI认证(伦理培训)并签署数据使用协议[^1]。 - 访问PhysioNet官网:https://physionet.org/ - 注册账号并提交“Credentialed Access”申请 2. **安装与配置** - Windows环境下可通过优快云教程《MIMIC-III 数据库安装》逐步操作,包括数据解压、PostgreSQL数据库配置等。 - 数据文件通常包含多个CSV表格,需按脚本导入数据库。 --- #### 二、使用教程与数据处理 1. **Python读取MIMIC-IV数据** ```python import pandas as pd # 分块读取超大CSV文件(适合内存不足场景) chunk_iter = pd.read_csv('mimiciv/icu/chartevents.csv', chunksize=10000) for chunk in chunk_iter: process(chunk) # 自定义处理函数 ``` - **高效工具推荐**: - `pandas`分块读取(`chunksize`参数) - `dask`分布式处理(适合TB级数据) - `PySpark`(集群环境适用)[^2] 2. **核心操作步骤** - **数据探索**:从`patients`、`admissions`表开始,关联临床事件表(如`labevents`)。 - **字段筛选**:使用`usecols`参数减少内存占用。 - **时间序列处理**:重点关注`charttime`字段的时序对齐。 --- #### 三、数据结构(以MIMIC-IV为例) MIMIC-IV分为多个模块,核心结构如下: | 模块 | 主要表格 | 关键字段示例 | |-----------|------------------------------|--------------------------------| | `hosp` | `patients`, `admissions` | `subject_id`, `gender`, `admittime` | | `icu` | `icustays`, `chartevents` | `stay_id`, `itemid`, `valuenum` | | `lab` | `labevents`, `d_labitems` | `specimen_id`, `loinc_code` | - **典型关联关系**: 患者(`patients`)→ 入院记录(`admissions`)→ ICU停留记录(`icustays`)→ 生理指标(`chartevents`)[^2] ---
评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Foneone

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值