2、基于向量空间模型的乳腺癌化疗治疗史检索与分类

基于向量空间模型的乳腺癌化疗治疗史检索与分类

1. 引言

在医疗领域,电子病历(EMR)包含了大量的临床事件日志。为了更好地利用这些数据,我们可以使用向量空间模型(VSM)来对临床事件日志进行建模。传统的VSM在自然语言处理中得到了广泛应用,但在处理EMR数据时,缺乏对时间信息的考虑。本文将介绍如何将时间信息融入VSM,以支持对患者治疗史的搜索和分类任务。

2. 方法

传统的VSM将文档表示为词向量,向量空间的每个维度代表语料库中的一个词。在信息检索中,查询词也表示为向量,通过计算向量之间的余弦相似度来对文档进行排序。

我们的方法是在VSM中加入时间项,以支持以下两个任务:
- 找到与临床计划最匹配的治疗史。
- 将治疗史分类为特定的治疗计划。

为了实现这两个任务,我们构建了五种不同的VSM:
- 传统VSM(VSM) :不包含时间项,仅使用临床事件日志中的事件。
- 顺序VSM(sVSM) :包含基于事件线性成对序列的先后项和共现项。
- 时间VSM(tVSM) :包含所有相遇之间的先后关系项。
- 传统 + sVSM :传统VSM和sVSM的向量项的并集。
- 传统 + tVSM :传统VSM和tVSM的向量项的并集。

以下是这些模型的具体说明:
| VSM方法 | 说明 |
| ---- | ---- |
| 传统VSM |

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值