云环境下的物联网分析:全面指南
1. 分布式计算
分布式计算,也称为集群计算,是指使用抽象各个服务器协调的框架,将进程分散到多个服务器上。这些框架让你感觉像是在使用一个统一的系统,实际上可能涉及从几个到数千个服务器(称为节点),框架会为你处理编排工作。
在物联网分析中,分布式计算的优势在于可扩展性。你可以通过向集群添加节点来增加资源,而无需更改分析代码。目前最常用的框架是Hadoop。
不过,在使用分布式计算时,要尽量避免将分析工作局限于一台服务器(有少数例外情况),因为这会限制可扩展性。以下是一些适合使用单服务器进行简单分析的情况:
- 无需大规模扩展 :即使物联网设备和数据数量激增,分析过程也无需太多更改。例如,分析过程对按月汇总的数据进行预测,设备数量对结果影响不大。
- 处理小数据 :分析仅针对一小部分数据进行,数据大小对分析结果影响较小,如对随机样本进行分析。
- 资源需求极少 :即使数据量增加几个数量级,你也不太可能需要超过标准服务器所能提供的资源,此时保持简单即可。
2. 持续交付
物联网分析领域发展迅速,你今天创建的分析可能会随着结果反馈和业务条件的变化而多次更改。因此,要假设变化是持续的,并为变化进行设计,这就引出了持续交付的概念。
持续交付源自软件开发,它能自动将代码发布到生产环境,使变更成为常规流程。将这一概念应用到分析中,可通过保留一组同时存在的副本来经历三个阶段:
1. 开发阶段 :保留一份分析副本,用
超级会员免费看
订阅专栏 解锁全文
7万+

被折叠的 条评论
为什么被折叠?



