大数据时代的临床试验数据管理
1. 临床试验数据处理流程
1.1 数据提取与标签使用
在处理临床试验数据时,我们会使用一系列标签来提取各试验的方法和细节。具体如下:
- 设计方面:使用 <allocation> 、 <intervention_model> 和 <masking> 标签。
- 机构方面:使用 <lead_sponsor> 和 <collaborator> 标签。
- 其他方面:使用其他标签提取健康状况、主要研究、标题、简短标题、年龄、入组情况、排除标准、健康志愿者、纳入标准、性别、阶段、状态、描述以及开始和完成日期等信息。
1.2 名称规范化
为了规范名称,我们采用每个临床试验方法中的健康状况信息。由于同一概念存在不同的命名约定,我们通过自动化数据规范化来识别唯一名称,并将唯一关键词用作试验上下文。具体操作是下载人类疾病本体(Human Disease Ontology)来检测每个试验中健康状况的唯一标识符。
1.3 语义丰富
利用上一阶段得到的标识符,我们可以检测健康状况的定义、其他知识源中的等效标识符,以及代表其医疗指南的统一资源标识符(URI),从而丰富健康状况的语义信息。
1.4 结果与试验关联
为了保留试验与其发表结果之间的关系,我们在模型中将每个结果出版物与其原始临床试验进行关联。从 ClinicalT
超级会员免费看
订阅专栏 解锁全文
1019

被折叠的 条评论
为什么被折叠?



