【MIMIC数据库教程】十二、使用Python提取所有患者的高密度脂蛋白(HDL)指标


【MIMIC数据库教程】十二、使用Python提取所有患者的高密度脂蛋白(HDL)指标

摘要: 在本专栏第九和十篇文章中,介绍了从MIMIC-IV数据库的Hosp模块的labevents表中提取所有患者的尿酸指标和ICU模块下患者的尿酸指标,本篇文章介绍如何提取患者的高密度脂蛋白指标,包括ICU模块和Hosp模块,并合并两部分结果。

检索HOSP模块中高密度脂蛋白检查的itemid

hosp模块高密度脂蛋白检查的详细信息包含在d_labitem表中,表中itemid字段表示检查项目,label字段表示检查名称,高密度脂蛋白的标准英文是Cholesterol, HDL或者缩写为HDL,我们检索d_items表中label字段包含Cholesterol, HDL的itemid, 代码如下:

# 查找hosp模块下的高敏C反应蛋白itemid
import pandas as pd

# 读取CSV文件
df = pd.read_csv('d_labitems.csv')
# 检索label中包含'Cholesterol, HDL'的行
filtered_df = df[df['label'].str.contains('Cholesterol, HDL', case=False, na=False)]
# 将DataFrame转换为Markdown表格
markdown_output = filtered_df.to_markdown(index=False)
# 显示Markdown格式的输出
print(markdown_output)



检索结果如下,因此确定itemid为50904。

itemid label fluid category
50904 “Cholesterol, HDL” Blood Chemistry

从labevents中提取所有存在高密度脂蛋白检查的患者

在确定高密度脂蛋白检测的itemid=50904后,从labevents表中提取所有存在高密度脂蛋白检查的患者,代码如下:

import pandas as pd

# 定义每次读取的块大小
chunksize = 10**6  # 根据内存情况可以调整
file_path = 'labevents.csv'  # 表格文件路径
output_file = 'HOSP_高密度脂蛋白.csv'  # 输出文件路径

# 初始化一个空的DataFrame,用于存储结果
filtered_data = pd.DataFrame()

# 分块读取CSV文件
for chunk in pd.read_csv(file_pa
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值