三角选择原则:
精准+实时+大数据
(1)精准+实时:没有大数据,数据量很小,一般就是指单机环境
(2)精准+大数据:hadoop,批处理,非实时,可以处理少量数据,保证精准,可能会跑几个小时;
(3)大数据+实时:es,不精准,近似估计,可能会有百分之同的错误率
近似聚合算法:
如果采取近似估计算法:延时在100ms左右,0.5%错误率
如果采取100%精准算法:延时几秒~几十秒,甚至几十分钟,0%错误率
三角选择原则:
精准+实时+大数据
(1)精准+实时:没有大数据,数据量很小,一般就是指单机环境
(2)精准+大数据:hadoop,批处理,非实时,可以处理少量数据,保证精准,可能会跑几个小时;
(3)大数据+实时:es,不精准,近似估计,可能会有百分之同的错误率
近似聚合算法:
如果采取近似估计算法:延时在100ms左右,0.5%错误率
如果采取100%精准算法:延时几秒~几十秒,甚至几十分钟,0%错误率