
大数据
lili0710432
Fortune favors the dream with attention
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大数据——海量数据处理的基本方法总结
声明: 原文引用参考July大神的csdn博客文章 => 海量处理面试题 海量数据处理概述所谓海量数据处理,就是数据量太大,无法在较短时间内迅速解决,无法一次性装入内存。本文在前人的基础上总结一下解决此类问题的办法。那么有什么解决办法呢? 时间复杂度方面,我们可以采用巧妙的算法搭配合适的数据结构,如Bloom filter/Hash/bit-map/堆/数据库或倒排索引/trie树。空间翻译 2015-09-03 22:26:45 · 532219 阅读 · 0 评论 -
架构——Hadoop深入介绍
Hadoop是一个分布式系统基础架构,最核心的包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase。原创 2016-07-28 01:48:10 · 431838 阅读 · 0 评论 -
用户画像——ID-Mapping
讲解ID-Mapping算法之前,先说几个重要概念: MAC(Media Access Control),MAC位址,为网卡的标识,唯一标识网络设备。 IMEI(International Mobile Equipment Identity),通常说的手机序列号、手机“串号”,在移动电话网络中识别每一部独立的手机等行动通讯装置;序列号共有15位数字,前6位(TAC)是型号核准号码,代表手机类型原创 2018-01-04 14:46:31 · 175458 阅读 · 5 评论