
海量数据
iteye_8135
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
[zz]Big Data技术综述
文/蒋杰 Big Data是近来的一个技术热点,但从名字就能判断它并不是什么新词。毕竟,大是一个相对概念。历史上,数据库、数据仓库、数据集市等信息管理领域的技术, 很大程度上也是为了解决大规模数据的问题。被誉为数据仓库之父的Bill Inmon早在20世纪90年代就经常将Big Data挂在嘴边了。 然 而,Big Data作为一个专有名词成为热点,主要应归功于近年来互...原创 2011-08-07 15:14:59 · 208 阅读 · 0 评论 -
【zz】十七道海量数据处理面试题与Bit-map详解
来自http://blog.youkuaiyun.com/v_july_v/article/details/6685962,推荐v_july_v的博客 十七道海量数据处理面试题与Bit-map详解 作者:小桥流水,redfox66,July。 文章性质:整理。 前言 本博客内曾经整理过有关海量数据处理的10道面试题(十道海量数据处理面试题与十个方法大总结 )...原创 2011-08-17 10:43:20 · 204 阅读 · 0 评论 -
倒排索引
1.什么是倒排索引 倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引。 带有倒排索引的文件我们称为倒排索引文件,简称倒排文件 (inverted file) 。 2.实例 下面利用一个例子来说明倒排...原创 2011-09-02 14:06:07 · 179 阅读 · 0 评论 -
[zz]海量数据面试题举例
大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到。 下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎与我讨论。 ...原创 2011-05-08 18:25:34 · 106 阅读 · 0 评论