【MIMIC-IV/pytorch实战】基于word2vec、transformer进行英文影像报告文本分类
完成这个任务的完整流程可以分以下几步数据整理word2vec构建模型数据整理MIMIC-IV中的文本数据在MIMIC-CXR模块中,影像报告以txt格式储存,每份报告为一个txt文件,如下病人与报告之间通过一个cxr-study-list表相关,通过这张表我们可以获取报告对应病人的其他信息,如是否死亡、患病等情况作为标签。这部分程序主要完成两步,一是通过疾病筛选患者,因为都是胸片报告,因此我筛选出肺癌患者二是提取文本,并删除所有换行符,这步主要程序可见这篇博客: python导入txt文件并删
原创
2022-01-24 22:41:32 ·
3218 阅读 ·
7 评论