TrialGPT:项目核心功能/场景
利用大型语言模型实现患者与临床试验的零样本匹配。
项目介绍
临床试验常常面临患者招募的挑战。为此,我们推出了TrialGPT项目,这是一个创新的端到端框架,通过大型语言模型(LLM)实现患者与临床试验的零样本匹配。TrialGPT由三个关键组件组成:首先,它在大规模上进行无关临床试验的过滤(TrialGPT-Retrieval);其次,它在准则的基础上预测患者是否符合条件(TrialGPT-Matching);最后,它将准则级别的预测聚合为临床试验级别的评分进行排序(TrialGPT-Ranking)。我们在三个公开可用的合成患者队列上评估了TrialGPT,共包含183个合成患者和超过75,000个临床试验资格注释。
项目技术分析
TrialGPT利用了大型语言模型的强大能力,通过三个主要步骤实现患者与临床试验的匹配:
- TrialGPT-Retrieval:给定患者摘要和初始临床试验集合,此步骤生成患者关键词,并利用混合融合检索机制获取相关临床试验。
- TrialGPT-Matching:在检索到的候选临床试验上,此步骤对每个患者-临床试验对进行细粒度的准则级别分析。
- TrialGPT-Ranking:最后,此步骤将准则级别的预测聚合为临床试验级别的评分,并进行排序。
项目技术应用场景
TrialGPT适用于临床试验的招募环节,尤其是在以下场景中:
- 提高招募效率:通过自动化的患者-临床试验匹配,显著减少人工筛选时间。
- 优化临床试验资源分配:确保临床试验能够吸引到最合适的患者群体。
- 改善患者体验:为患者提供与其健康状况最匹配的临床试验信息。
项目特点
- 高效性:TrialGPT-Retrieval能够以不到6%的初始临床试验集合高效地检索到超过90%的相关临床试验。
- 准确性:在准则级别的匹配上,TrialGPT-Matching达到了87.3%的准确性,接近专家表现(88.7%–90.0%)。
- 相关性:TrialGPT-Ranking的聚合评分与人类资格判断高度相关,并在排名和排除临床试验方面超过了最佳竞争模型。
- 实用性:实际用户研究表明,TrialGPT可以显著减少临床试验匹配任务中的筛选时间,提高工作效率。
TrialGPT项目的推出,为临床试验招募带来了革命性的改变,不仅提高了匹配的效率和准确性,也为患者和研究人员带来了实实在在的好处。在未来,我们期待看到更多的研究和应用案例,以进一步验证和推广这一框架的实际价值。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



