实时大数据分析与远程医疗记录缺失值插补
实时大数据分析
实时大数据分析数据栈
David Smith提出了一个实时大数据分析(RTBA)模型,该模型包含四个层次,每个层次都有其特定的工具来处理相应的工作:
1. 数据层 :此层存储和处理来自不同来源的结构化、非结构化和半结构化数据。结构化数据的示例包括关系型数据库管理系统(RDBMS)、NoSQL等;非结构化数据的示例有Hadoop的MapReduce、来自网络和传感器的流数据等。
2. 分析层 :该层定期从数据层获取数据和更新。数据和更新的传输通过本地数据集市完成。分析层包括用于部署实时评分和动态分析的生产环境,以及用于构建模型的开发环境,并且靠近分析引擎以提高性能。
3. 集成层 :集成层是终端用户应用程序和分析引擎之间的接口。它通过规则引擎或复杂事件处理(CEP)引擎以及应用程序编程接口(API)来执行动态分析,促进应用程序开发人员和科学家之间的通信。
4. 决策层 :所有层次的分析结果在这一层可视化呈现给终端用户。终端用户可以通过各种应用程序访问分析结果,如桌面应用、移动应用、交互式网页应用以及商业智能软件。
| 层次 | 功能 | 示例工具 |
|---|---|---|
| 数据层 | 存储和处理不同类型数据 | RDBM |
超级会员免费看
订阅专栏 解锁全文
45

被折叠的 条评论
为什么被折叠?



