hadoop
文章平均质量分 81
leebhing
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ZooKeeper 原理及其在 Hadoop 和 HBase 中的应用
原文:www.linbingdong.comZooKeeper是一个开源的分布式协调服务,由雅虎创建,是Google Chubby的开源实现。分布式应用程序可以基于ZooKeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。简介ZooKeeper是一个开源的分布式协调服务,由雅虎创建,是Goog转载 2017-03-14 09:16:29 · 445 阅读 · 0 评论 -
jdbc连接hive的问题
利用hive jdbc连接hive出现如下问题: org.apache.hive.jdbc.HiveDriverorg.apache.hive.jdbc.HiveDriverhive_driver:org.apache.hive.jdbc.HiveDriverhive_url:jdbc:hive2://10.174.242.28:10000/defaultgetconnection原创 2017-11-08 18:14:35 · 2467 阅读 · 0 评论 -
spark中出现org.apache.htrace找不到的错误
在CDH中,开发的spark连接Hbase的时候,往往会出现找不到org.apache.htrace包。具体错误如下:? ? ? ERROR TableInputFormat: java.io.IOException:?? ? ? java.lang.reflect.InvocationTargetException? ? ?Caused by: java.lang.NoC原创 2017-11-08 15:55:44 · 8925 阅读 · 0 评论 -
海量数据解决思路之BitMap
一、概述 本文将讲述Bit-Map算法的相关原理,Bit-Map算法的一些利用场景,例如BitMap解决海量数据寻找重复、判断个别元素是否在海量数据当中等问题.最后说说BitMap的特点已经在各个场景的使用性。二、Bit-Map算法先看看这样的一个场景:给一台普通PC,2G内存,要求处理一个包含40亿个不重复并且没有排过序的无符号的int整数,给出一个整数,问如果转载 2017-09-27 11:06:29 · 405 阅读 · 0 评论 -
Hbase中内置Filter详解
一、建表1、表名:“ORDER_TABLE”2、列簇:“user”,“order”,“item”3、表结构如下: 二、封装服务服务代码如下:[java] view plain copy@Override public String get(String tableName, Filter转载 2017-08-10 09:23:09 · 2283 阅读 · 0 评论 -
MapReduce生成HFile文件,再使用BulkLoad导入HBase中(完全分布式运行)
声明: 若要转载, 请标明出处.前提: 在对于大量的数据导入到Hbase中, 如果一条一条进行插入, 则太耗时了, 所以可以先采用MapReduce生成HFile文件, 然后使用BulkLoad导入hbase中. 引用:一、这种方式有很多的优点:1. 如果我们一次性入库hbase巨量数据,处理速度慢不说,还特别占用Region资源, 一个比较高效便捷的方法就是使转载 2017-07-25 15:06:07 · 1395 阅读 · 1 评论 -
Failed deleting my ephemeral node
Failed deleting my ephemeral node2017-01-05 11:07:39,490 WARN zookeeper.RecoverableZooKeeper: Node /hyperbase1/rs/tw-node1217,60020,1483585655650 already deleted, retry=false2017-01-05 1原创 2017-08-09 09:25:04 · 1526 阅读 · 0 评论 -
CDH集群报一个DataNode未连接上的错误
之前有一次,启动CDH集群突然报slave03这个DataNode未连接上的错误,直接导致HBase等服务组件出现问题经过排查,一开始,将原来的hosts文件:192.168.1.15 archive.cloudera.com192.168.1.7 slave01192.168.1.11 slave02192.168.1.12 cc.co.com192.168.原创 2017-04-13 16:05:47 · 2058 阅读 · 0 评论 -
sqoop常用命令整理
1、列出mysql数据库中的所有数据库 sqoop list-databases --connect jdbc:mysql://localhost:3306/ -username root -password 0000002、连接mysql并列出数据库中的表sqoop list-tables --connect jdbc:mysql://localhost:3306/test --us原创 2017-03-24 15:18:10 · 6255 阅读 · 0 评论 -
重启CDH的方法以及问题解决
重启CDH的方法如下:service cloudera-scm-server-db restartservice cloudera-scm-server restartservice cloudera-scm-agent restart(这个还需要在每个slave上执行)启动服务cloudera-scm-server时会遇到过一段时间自己挂掉,并原创 2017-11-27 19:12:07 · 13729 阅读 · 1 评论
分享