Mining Data Streams(1)——数据流挖掘学习笔记
概述
数据流不同于数据库,有几个特点:数据流的实时性,导致其需要被立即处理,否则会永远消失。同时一般数据量太大太快,动态存储无法存储全部数据。所以在处理数据流的时候,一般会采用两种算法:1、利用采样和过滤的思想对流实时处理,去除不必要的元素。2、存储固定长度的窗口,对进入窗口的元素进行整合、计算,然后再利用估计和概率提供近似的答案。
数据流模型
可以看到这个模型中有数据数据流、流处理器、...
原创
2019-12-28 19:35:09 ·
1552 阅读 ·
0 评论