
大数据
大数据
嘻哈吼嘿呵
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
一、十大海量数据处理方法总结
一、布隆过滤器(BloomFilter) 如果想判断一个元素是不是在一个集合里,一般想到的是将集合中所有元素保存起来,然后通过比较确定。链表、树、散列表(又叫哈希表,Hash table)等等数据结构都是这种思路,存储位置要么是磁盘,要么是内存。很多时候要么是以时间换空间,要么是以空间换时间。 在响应时间要求比较严格的情况下,如果我们存在内里,那么随着集合中元素的增加,我们需要的存储空间越来越...转载 2020-06-30 16:15:31 · 1573 阅读 · 0 评论 -
一、DB、DW、DM、ODS、OLAP、OLTP和BI的概念理解
1、DB(DataBase):数据库,一般指的就是OLTP数据库,在线事物数据库,用来支持生产的。DB保留的是数据信息的最新状态,只有一个状态! 2、DW(Data Warehouse):数据仓库,保存的是数据在不同时间点的状态,对同一个数据信息,保留不同时间点的状态,便于我们做统计分析。 3、关于DM,目前网上有两种说法,一说数据集市(Data Mart);一说数据挖掘(Data...转载 2019-09-06 14:50:01 · 3212 阅读 · 0 评论