
Hadoop
紧到长卜帅
https://github.com/happyapple668
展开
-
Azkaban源码阅读
目录结构: Azkaban分为8个大模块: az-core:基础模块. azkaban-common:公共模块. azkaban-db:提供访问数据库模块. azkaban-exec-server:具体执行任务的模块. azkaban-web-server原创 2017-12-28 14:56:55 · 4080 阅读 · 3 评论 -
内存小于16GG搭建Hadoop集群的一些个人观点
很多同鞋在学习大数据过程中,也会在自己电脑上搭建环境,但是内存不足确实是个让人头疼的问题,废话不多说,个人有如下一些想法,分享给大家:1、使用apache原生的hadoop来搭建集群,除了配置繁琐之外,还可能会有很多版本兼容性的问题(这很是头疼的问题),当然在一些组件的官网有明确的版本依赖性说明,搭建haddop+hive或者hadoop+hbase等,管理起来也非常的不便,得自己写脚本来实现监控。原创 2017-07-09 16:13:58 · 14138 阅读 · 5 评论 -
MR解析hdfs操作日志文件示例
针对如下样例文件:2016-04-03 22:53:19,912 INFO FSNamesystem.audit: allowed=true ugi=hdfs (auth:SIMPLE) ip=/192.168.0.4 cmd=getfileinfo src=/tmp dst=null perm=null proto=rpc2016-04-03 22:53:26,141 IN原创 2017-06-04 17:18:48 · 3084 阅读 · 2 评论