保险理赔欺诈检测的 Lambda 架构实践
1. 数据模型概述
1.1 实体与关系
在保险业务的数据环境中,存在多个关键实体,如 Claim_status
、 Claim_type
、 Policy_type
等。 Policy_owner
实体包含 PolicyOwnerDOB
(保单所有者出生日期)和 PolicyStartDate
(保单开始日期)列, Claim
实体有 ClaimWeatherCond
(理赔申请时的天气状况)列。此外, PO_Drv_Hist
实体存储保单所有者的驾驶历史详细信息,其属性如下:
| 属性 | 描述 |
| ---- | ---- |
| PolicyOwnerId (FK) | 保单所有者 ID(外键) |
| ViolationNum | 违规次数 |
| ViolationSeverity | 违规严重程度 |
| ViolationDate | 违规日期 |
| ViolationDetails | 违规详情 |
PolicyOwner
和 PO_Drv_Hist
实体之间存在一对多关系,即一个保单所有者可能有一个或多个违规记录,如果没有违规记录,则 PO_Drv_Hist
实体中不会有该保单所有者的记录