《大数据+AI在大健康领域中最佳实践前瞻》---- 检验检测中的单一实体识别前瞻与探索


简介

在医学数据库中的大多数初始记录不包含任何患者标识符信息。为了分析和检测这些患者记录的异常,需要关于该特定患者的先前病历信息进行匹配。没有这些信息,匹配被检测人的任务将非常具有挑战性。该系统的目的是根据提供的特征将患者ID分配给患者记录。
基于分配ID的特征性质,系统主要在两个阶段中执行任务。

1、硬实体分解(特征的精确匹配)
2、软实体解析(在给定的特征值范围内聚类实体)

本设计采用面向对象的设计模式,自顶向下逐步细化业务功能,融合了先进的AI算法通过特征匹配,聚类,精准的匹配出患者的原始记录并给出ID.

系统流程图

在这里插入图片描述

系统输入

模块的输入包括硬聚类和软聚类阶段的特征规范和软聚类的参数。输入同时还包括指定执行的软聚类的参数类型。

输出

系统输出模块的输出为一个包含全量数据的Spark数据框,其中每一条检测者记录都有一个全局唯一的PI_ID。

硬聚类

硬聚类根据详细的硬约束将所有记录进行严格的匹配,然后相应的将记录聚类。
例: 基于硬约束的硬聚类: PI_NAME, PI_FROM, PI_SEX 属性相同我们认为为同一个检测者

原始数据
REC_ID

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

shiter

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值