
大数据
i_chips
Life is slight while live is bright.
展开
-
【知乎】能不能用形象的比喻描述一下大数据的技术生态?
大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤,你可以用小刀或者刨子去皮。但是每个工具有自己的特性,虽然奇怪的组合也能工作,但是未必是最佳选择。大数据,首先你要能存的下大数据。传统的文件系统是单机的,不能横跨不转载 2015-02-06 14:45:06 · 3737 阅读 · 0 评论 -
常见的大数据术语表
本文由 伯乐在线 - 小胖妞妞 翻译,蓝枫紫叶 校稿。未经许可,禁止转载!英文出处:www.bigdata-startups.com。欢迎加入翻译小组。大数据的出现带来了许多新的术语,但这些术语往往比较难以理解。因此,我们通过本文给出一个常用的大数据术语表,抛砖引玉,供大家深入了解。其中部分定义参考了相应的博客文章。当然,这份术语表并没有100%包含所有的术语,如果你认转载 2015-02-12 14:01:21 · 1506 阅读 · 0 评论 -
【采集层】Kafka 与 Flume 如何选择
原文链接:http://my.oschina.net/frankwu/blog/355298原文作者:http://my.oschina.net/frankwu采集层 主要可以使用Flume, Kafka两种技术。Flume:Flume 是管道流方式,提供了很多的默认实现,让用户通过参数部署,及扩展API.Kafka:Kafka是一个可持久化转载 2015-08-06 10:18:20 · 1301 阅读 · 1 评论 -
开源日志系统比较
原文链接:http://dongxicheng.org/search-engine/log-systems/原文作者:http://dongxicheng.org/about/1. 背景介绍许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征:(1) 构建转载 2015-08-06 10:52:03 · 866 阅读 · 0 评论