HBase + Hadoop 错误小结

1.Windows下提交报用户权限问题

conf.set("user", "hadoop"); //或者相应的用户名

2.windows下提交报/bin/bash: line 0: fg: no job control

conf.set("mapreduce.app-submission.cross-platform", "true");

3.运行中报ClassNotFound问题

出现以下的错误:

java.lang.RuntimeException: 
java.lang.ClassNotFoundException: Class GeoHashLib.Hbase.HbaseScannerTest$Map not found

使用

TableMapReduceUtil.addDependencyJars(conf, xx.class);

4.运行时报OOM错误

这个错误是mapreduce过程和java虚拟机设置的内存使用过小,通过以下这几个参数进行改善(无需修改到配置文件中)

conf.set("mapreduce.map.memory.mb", "2048");
conf.set("mapreduce.map.memory.mb", "3072");

conf.set("mapreduce.map.java.opts", "-Xmx1024m");
conf.set("mapreduce.reduce.java.opts", "-Xmx2048m");
Hive、HBaseHadoop是三种流行的大数据技术,它们都有不同的用途和优势。Hadoop是一个分布式系统平台,它可以处理大量的数据,并提供高性能的数据处理。Hive是一个数据仓库,它可以通过SQL查询访问Hadoop中的数据。HBase是一个分布式数据库,它可以实存储和访问大量的非结构化数据。 在部署Hive、HBaseHadoop,需要注意以下几点: 首先,需要想好在哪里安装这些组件,是否在同一台服务器上安装。通常情况下,为了实现最佳性能,最好在分布式服务器集群上安装它们。 其次,需要安装和配置Hadoop,并确认其正常运行。这包括设置Hadoop目录结构、配置Hadoop的XML配置文件、启动Hadoop服务等。 第三,需要安装并配置HBase。这包括设置HBase目录结构、配置HBase的XML配置文件、启动HBase服务、设置HBase集群等。需要确保HBase的表空间和列族的设计符合需求,并且表的分布在整个HBase集群中。 最后,需要安装并配置Hive。这包括设置Hive目录结构、配置Hive的XML配置文件,启动Hive服务等;同需要确保配置Hive的JDBC连接和ODBC连接,以便于应用程序使用Hive。还应检查Hive与HadoopHBase的兼容性,并进行充分测试以确保其正常运行。 总之,Hive、HBaseHadoop的部署需要仔细考虑,并按照最佳实践进行。只有这样,才能在大数据处理中获得最佳性能和效益。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值