利用 NoSQL 进行大数据挖掘:CMS 开放支付数据应用开发
1. 数据探索与背景介绍
在大数据挖掘的领域中,对各种数据集的探索和分析至关重要。以 MongoDB Compass 为例,我们可以通过点击左侧边栏单词旁边的箭头来扩展 nobel 数据库。还能点击并拖动条形图的不同部分,运行临时查询。这对于想要全面了解数据集,而不必手动运行所有查询的用户来说非常有用。
在医疗领域,医生和医院会从各种外部组织获得支付,例如制药公司。制药公司会派遣销售代表,不仅向从业者介绍他们的产品,还会提供礼品或实物支付等。从理论上讲,给予医生的礼品或支付并非旨在影响他们的处方行为,制药公司也会采取谨慎措施,对支付给医疗服务提供者的款项进行制衡。
2010 年,奥巴马总统签署的《平价医疗法案》(ACA),也就是广为人知的“奥巴马医改”生效。与此同时,一项名为《阳光法案》的单独立法,要求制药公司和其他组织必须报告具有货币价值的项目(直接或间接)。虽然此类规则过去就存在,但很少能在公共领域获取。《阳光法案》通过公开所有医生的详细支付记录,为涉及医疗服务提供者的货币交易带来了前所未有的透明度。
相关数据可在 CMS 开放支付网站(https://openpaymentsdata.cms.gov)上免费获取。该网站提供了查询数据的界面,但没有进行大规模数据聚合的方法。例如,如果用户想查找康涅狄格州(CT)的总支付金额,通过默认的基于网络的工具很难简单便捷地运行查询。虽然有提供此功能的 API,但需要一定的熟悉程度和技术知识才能有效使用。也有第三方产品提供此类服务,但大多数情况下价格昂贵,最终用户无法根据自身特定需求修改软件。