38、利用混合机器学习检测医疗欺诈：方法与应用

最新推荐文章于 2025-10-01 15:51:20 发布

day7

最新推荐文章于 2025-10-01 15:51:20 发布

阅读量20

点赞数

CC 4.0 BY-SA版权

分类专栏：工程中的统计学习文章标签：医疗欺诈检测混合机器学习 OCR

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/day7/article/details/152405638

工程中的统计学习专栏收录该内容

53 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

利用混合机器学习检测医疗欺诈：方法与应用

1. 医疗欺诈检测中的数据分类

在医疗欺诈检测中，我们区分出六种不同的数据类别：
1. SC ：针对单个患者和一个月的数据。
2. NI ：针对单个护士和一天的数据。
3. 患者列表 ：针对护理服务而言是特定的，但对该护理服务内的所有患者是通用的。
4. 护士列表 ：包含护士的资格以及整体护理服务的数据，同样针对护理服务特定，对服务内所有护士通用。
5. 保险公司列表 ：作为核心信息全局提供，对所有护理服务都相同。
6. 服务列表 ：包含标准化术语、同义词和所需资格，也是全局提供的核心信息。

这些数据类别在分析时相互关联，添加数据（3）到（6）并非简单地增加数据源，而是会使包含数据（1）或（2）的文档视图数量成倍增加，而非简单相加。

2. 护理服务文档数字化

传统的光学字符识别（OCR）技术虽成熟，但对于护理服务文档的数字化存在不足，因其识别内容未稳定排序且上下文有限，无法自动分析文档。因此，提出了一个两步流程：
1. 结构检测 ：识别文档的结构，将文档按内容进行分割。
2. 内容识别 ：根据内容类型采用不同的识别方法。

这种模块化的流程能适应不同护理服务文档的布局和内容。

2.1 结构检测 </

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。