Hadoop World 大会上的文章选摘(一)

本文讨论了在Hadoop+HBase环境下,通过优化压缩算法(如LZO与Snappy)、自定义序列化机制(使用JSON除外特定数据类型)、重新设计无索引方案等方法,提升系统性能与稳定性。同时,针对部署策略,避免运行ZooKeeper实例于数据节点、不将HMaster置于NameNode之上,并建议采用额外的Master实例以防止单一故障点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Compression

         LZOor Snappy(20% better than LZO)——Block(default)

 

Serialization

         AVROdidn’t work well——deserialization issue

         Developedconfigurable serialization mechanism that uses JSON except Data type

 

Secondary Indexes

         Wereusing ITHBase and IHBase from contrib——doesn’t work well

         Redesignedschema without need for index

         Westill need it though

 

Performance

         Severaltunable parameters

        

Hardware(Hadoop+HBase)

         DataNode -24GB RAM,8Cores,4*1TB(64GB,24Cores,8*2TB)

         6mappers and 6 reducers per node (16 mappers,4reducers)

         Memoryallocation by process

         DataNode——1GB(2GB)

         TaskTracker——1GB(2GB)

         MapTasks——6*1GB(16*1.5GB)

         ReduceTasks——6*1GB(4*1.5GB)

         RegionServer——8GB(24GB)

         TotalAllocation——24GB(64GB)

 

Deployment

         Donot run ZK instances on DN,have a separate ZK quorum(3 minimum)

         Donot run HMaster on NN

         AvoidSPOF for HMaster(run additional master(s))

         

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值