MIMIC-Extract 项目使用教程

MIMIC-Extract 项目使用教程

MIMIC_Extract MIMIC-Extract:A Data Extraction, Preprocessing, and Representation Pipeline for MIMIC-III 项目地址: https://gitcode.com/gh_mirrors/mi/MIMIC_Extract

1. 项目的目录结构及介绍

MIMIC-Extract 项目的目录结构如下:

MIMIC_Extract/
├── Data/
├── Notebooks/
├── Resources/
├── Utils/
├── .gitignore
├── LICENSE
├── README.md
├── datapackage_io_util.py
├── heuristic_sentence_splitter.py
├── mimic_direct_extract.py
├── mimic_extract_env_py36.yml
├── mimic_querier.py
└── postgres_make_extended_concepts.sh

目录介绍:

  • Data/: 本地存储待提取的数据。
  • Notebooks/: 包含 Jupyter Notebooks,用于演示测试用例和在风险和干预预测任务中使用输出数据的示例。
  • Resources/: 包含 Rohit_itemid.txt 文件,描述 MIMIC-III 和 MIMIC II 项目 ID 之间的相关性;itemid_to_variable_map.csv 文件,用于数据提取的主要文件,包含项目 ID 的分组以及哪些项目 ID 已准备好提取;variable_ranges.csv 文件,描述正常变量范围,协助提取适当的数据。
  • Utils/: 包含运行 MIMIC-Extract 数据管道的脚本和详细说明。
  • .gitignore: Git 忽略文件。
  • LICENSE: 项目许可证文件。
  • README.md: 项目说明文件。
  • datapackage_io_util.py: 数据包 I/O 工具脚本。
  • heuristic_sentence_splitter.py: 启发式句子分割器脚本。
  • mimic_direct_extract.py: 数据提取脚本。
  • mimic_extract_env_py36.yml: 项目环境配置文件。
  • mimic_querier.py: MIMIC 查询器脚本。
  • postgres_make_extended_concepts.sh: 用于构建扩展概念视图的脚本。

2. 项目的启动文件介绍

项目的启动文件是 mimic_direct_extract.py。该文件是 MIMIC-Extract 数据提取的主要脚本,负责从 MIMIC-III 数据库中提取数据并进行预处理。

使用方法:

python mimic_direct_extract.py --args

其中 --args 是可选参数,用于指定提取的参数和配置。

3. 项目的配置文件介绍

项目的配置文件是 mimic_extract_env_py36.yml。该文件定义了项目运行所需的环境配置,包括 Python 版本、依赖包等。

使用方法:

conda env create --force -f mimic_extract_env_py36.yml
conda activate mimic_data_extraction

以上命令将根据 mimic_extract_env_py36.yml 文件创建并激活一个新的 Conda 环境,确保项目所需的依赖包和 Python 版本正确安装。

MIMIC_Extract MIMIC-Extract:A Data Extraction, Preprocessing, and Representation Pipeline for MIMIC-III 项目地址: https://gitcode.com/gh_mirrors/mi/MIMIC_Extract

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

MIMIC-IV是一份医疗数据集,包含了大规模的多模态(诊断、手术、实验室检验结果等)的持续监测数据。该数据集是通过开放存取权限取得的,并且在假名化的情况下提供给研究人员使用MIMIC-IV数据集的目标是促进医疗研究的发展。它包含了来自美国波士顿市的波士顿儿童医院和波士顿岁丰医院的数据。这些数据可用于进行各种类型的研究,如疾病模型构建、机器学习算法的开发等。使用者可以通过提出请求并接受数据使用许可证来获取MIMIC-IV数据集。 在使用MIMIC-IV数据集时,需要注意一些保密和隐私方面的问题。由于数据含有患者的敏感信息,包括姓名、家庭住址等,因此使用者需要严格遵守数据使用规则。在进行研究时,应保持对患者个人隐私的尊重,并采取相应的安全措施确保数据不会被滥用或泄露。 此外,为了更好的利用MIMIC-IV数据集,使用者需要具备一定的医学和数据分析知识。因为该数据集提供了大量的多模态数据,正确解释和分析这些信息需要具备相关的领域知识。同时,对于数据的预处理和清洗也需要具备数据分析技巧。 总之,MIMIC-IV是一份丰富的医疗数据集,可以支持各种类型的研究。但是,在使用该数据集时,需要遵守相关的规则和保护患者隐私的原则,同时具备医学和数据分析的知识。通过正确使用MIMIC-IV数据集,研究人员可以为医疗领域的发展和人类健康做出更多的贡献。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

翟苹星Trustworthy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值