问题源于我用hive拉取数据总是有时候需要20min或以上,这就很不好了。因此考虑到hadoop,这也是必然要面对的,不如趁早
关于hadoop集群,入门的话肯定是安装啊,在安装之前不妨先认识下hadoop,
参考一些资料,网页,
如下
分为两个部分,一个是存储(HDFS),一个是处理(YARN)
存储则可以针对各种各样的数据,有没有结构或者半结构化的都可以,YARN则是针对HDFS存储的数据进行处理,
问题源于我用hive拉取数据总是有时候需要20min或以上,这就很不好了。因此考虑到hadoop,这也是必然要面对的,不如趁早
关于hadoop集群,入门的话肯定是安装啊,在安装之前不妨先认识下hadoop,
参考一些资料,网页,
如下
分为两个部分,一个是存储(HDFS),一个是处理(YARN)
存储则可以针对各种各样的数据,有没有结构或者半结构化的都可以,YARN则是针对HDFS存储的数据进行处理,