
hadoop权威指南笔记
文章平均质量分 80
dragon_fire
这个作者很懒,什么都没留下…
展开
-
hadoop权威指南 之 HDFS
一:HDFS hadoop distributed filesystem的设计目标 Very large files 单个文件和 文件总和 Steaming data access write-once,read mary times 流式数据读取。 commodity hardware 普通的硬件 HDFS 不适合的场景: low laten原创 2013-03-15 22:32:37 · 1328 阅读 · 0 评论 -
hadoop权威指南笔记之初识hadoop
1.大数据时代来临,要解决两个问题,一个是海量数据的存储,一个是对海量数据的分析。 a.目前数据存储的问题:存储工具的容量在不断加大,但是读写的速度却没有随之响应的增加。 解决方案是增加并行,也就是把数据存储到多个硬盘上,这时数据的备份就尤为重要,raid就是解决这个问题的方案。 b.数据分析:如果数据散落在100个硬盘上,那么数据的分析首先要将这100个硬盘上的数据进行整合。 2原创 2013-03-15 19:01:29 · 1062 阅读 · 0 评论