ES7.16.2基础操作之三角原则,近似聚合算法(十五)

本文探讨了大数据处理中的三角选择原则,即精准、实时与大数据的组合。精准+实时场景通常对应于小数据量的单机环境;精准+大数据则适合使用Hadoop进行批处理,但牺牲了实时性;而大数据+实时则通过如Elasticsearch实现,但可能接受一定的误差率。此外,介绍了近似聚合算法,它能在100ms内提供0.5%错误率的结果,对比之下,100%精准算法会显著增加延迟。这些权衡对于优化大数据系统的性能至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

三角选择原则:
精准+实时+大数据
(1)精准+实时:没有大数据,数据量很小,一般就是指单机环境
(2)精准+大数据:hadoop,批处理,非实时,可以处理少量数据,保证精准,可能会跑几个小时;
(3)大数据+实时:es,不精准,近似估计,可能会有百分之同的错误率

近似聚合算法:

如果采取近似估计算法:延时在100ms左右,0.5%错误率
如果采取100%精准算法:延时几秒~几十秒,甚至几十分钟,0%错误率

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值