接触大数据已经四年的时间了,从一开始hadoop开源社区到现在的CDH统一平台!中间遇到很多问题,趟过很多坑,也看过一些组件源代码。但是一直有个不爱整理的习惯!导致很多东西不是忘了就是形成知识碎片,很难将给个知识点连接起来。意识到这个问题后,笔者打算基于cdh整理一套连贯的文档!当然很多东西在cloudera官上已经存在,但是作为系统学习,还是将其整理出来!
本次整理顺序严格按照cloudera官网目录来整理!即先介绍cloudera的cm,cdh,cnd等产品,然后介绍起安装,再介绍其运维管理,最后介绍cdh各个各个大数据组件!其中cdh运维管理和各个大数据组件是本次的重点!别的只是简略描述!