公共数据利用与商业智能应用解析
1. 公共数据资源介绍
公共数据资源丰富多样,为各行业的分析和决策提供了有力支持。以下是一些常见的公共数据来源:
|数据来源|数据内容|用途|
| ---- | ---- | ---- |
|政治捐款数据|记录捐款贡献、捐款地址、受捐候选人或政治行动委员会以及捐款金额|可用于跟踪候选人支持情况、分析政治支出趋势,推断地域政治偏好|
|劳工统计局(BLS)数据|提供多种产品长期的价格历史摘要信息|辅助经济分析、市场趋势研究等|
|制药数据|包含单个药物、设备、给药方法和麻醉成分等信息,来自食品药品监督管理局(FDA)和缉毒局(DEA)|在保险行业和刑事司法领域有应用价值|
获取公共数据主要有两种途径:从原始来源收集数据和向数据聚合商购买增值数据集。
1.1 原始来源
- 政府数据 :政府是公共数据的优质来源,但由于国际、美国联邦和州政府有众多机构和部门,数据源管理成为额外的管理风险。此外,虽然数据价格可能合适,但将多个外部数据模型内化以及创建正确利用数据的流程可能会产生额外成本。而且,由于这些数据集以低价或免费提供给一般用户,数据消费者在强制保证数据质量和及时性方面的手段有限。
- 第三方网站和半结构化数据 :第三方可能以不可直接利用的形式提供公共信息,如网站上的数据或半结构化数据实例(如出生通知、婚礼公告、讣告、死亡通知、法律通知、传记、职位描述和简历等)。这些数据反映了一定的知识分类,但计算机程序难以直接处理。
- 数据主体提供的数
超级会员免费看
订阅专栏 解锁全文
1585

被折叠的 条评论
为什么被折叠?



