
hadoop
hadoop
跳蛙pass
这个作者很懒,什么都没留下…
展开
-
hive 报错 The auxService:mapreduce_shuffle does not exist
报错信息:Diagnostic Messages for this Task:Container launch failed for container_1644976539445_0002_01_000005 : org.apache.hadoop.yarn.exceptions.InvalidAuxServiceException: The auxService:mapreduce_shuffle does not exist at sun.reflect.NativeConstructorAcc原创 2022-02-21 09:11:00 · 705 阅读 · 0 评论 -
hive 报 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster
在这里解释一下 hive的报错输出报错不够明显,hive的控制台输出报错就是这个错:FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask但当查看yarn后台日志就不难发现他的真正的错是加载不到主类 如图解决办法:关键需要配置两个配置:mapred-site.xml 和 yarn-site.xml下面配置hadoop classpath。先运行shell命令:hadoop原创 2022-02-18 16:42:46 · 2702 阅读 · 1 评论 -
hive hue 报FAILED: ParseException line 10:41 mismatched input ‘.‘ expecting )
报错原因FAILED: ParseException line 10:41 mismatched input ‘.’ expecting )翻译大意:失败:解析异常行10:41输入不匹配。“”期待)这些基本都是语法解析有错,寻找对应报错的行数,查看语法错误解决方法字段间添加 ,修改后 : t1.dcjldbh, t1.zcbh...原创 2022-02-11 16:38:12 · 5832 阅读 · 0 评论 -
每日分享 hive hue 报错Error while compiling statement: FAILED: SemanticException Error in parsing
报错原因SemanticException Error in parsing翻译过来大意就是解析中的 SemanticException(语义异常) 错误解决办法应该修改成 a.dcbh 而不是 a,dcbh原创 2022-02-11 11:30:48 · 3527 阅读 · 0 评论 -
Hortonworks Docker Sandbox创建连接MySQL(实操)
这里写目录标题docker 连接mysql2122端口2222端口docker 连接mysql2122端口#查看CONTAINER IDdocker ps#删除CONTAINER IDdocker rm -f CONTAINER IDdocker images#进入 cd star_scripts修改start_sandbox.sh,start_sandbox-hdf.sh,start_sandbox-hdp.sh三个文件都添加-p 3306:3306 \执行./start_原创 2020-09-14 19:49:54 · 324 阅读 · 0 评论 -
Hadoop高可用集群搭建(实操、干货)
Hadoop一、HDFS-HA 集群配置1.1 配置 HDFS-HA 集群1.官方地址:http://hadoop.apache.org/2.HDFS 高可用集群规划,请保证 Hadoop 完全分布式和 ZooKeeper 完全分布 式环境已经安装完成。hadoop102 hadoop103JournalNode JournalNode 3.在 hadoop102 配置 core-site.xml<configuration> <!-- 把两个 N原创 2020-07-07 20:04:03 · 550 阅读 · 1 评论 -
Zookeeper分布式环境搭建(实操、干货)
文章目录一、解压安装包二、修改配置文件三、将配置好的文件分发都其他节点上四、在每个节点上的zkData目录下创建一个myid,里面写一个数字,数值不能重复一、解压安装包tar -zxf zookeeper-3.4.5-cdh5.14.2.tar.gz**移动**mv zook..... /opt/soft/zookeeper345二、修改配置文件cd /opt/soft/zookeeper345/confcp zoo_sample.cfg zoo.cfgvi zoo.cfg#数据存放目原创 2020-07-06 23:47:22 · 869 阅读 · 0 评论 -
Hadoop完全分布式环境搭建(实操)
文章目录1、环境准备1.1配置静态ip1.2修改主机名1.3配置主机映射2、安装jdk3、安装Hadoop4、完全分布式4.1集群准备4.2 设置免密登录4.3修改配置文件五、启动集群启动集群六、时间同步1、环境准备先准备一个纯净的centos7虚拟机,配置好静态ip,主机名,主机映射1.1配置静态ipvi /etc/sysconfig/network-scripts/ifcfg-ens33TYPE="Ethernet"PROXY_METHOD="none"BROWSER_ONLY="no"原创 2020-07-06 23:19:57 · 386 阅读 · 0 评论 -
HADOOP YARN原理及资源调度
文章目录1、ResourceManager2、NodeManager3、Applicacation Master4、yarn调度方式5、Yarn架构及各角色职责6、Yarn作业执行流程7、特点8、MapReduce在Yarn上的运转1、ResourceManagerReaouceManager(资源管理器RM)常驻守护进程:管理集群资源,负责全局资源的监控、分配和管理;接收来自Nodemanager的心跳信息,进行整体资源的汇总;监控Application Master的开启和创建2、NodeM原创 2020-07-01 20:13:32 · 592 阅读 · 0 评论 -
HBase安装、环境配置(亲测)
这里写目录标题HBase介绍HBase介绍1、HBase是hadoop领域的数据库2、HBase是面向列存储的列式数据库a)行式数据库优缺点**i.**数据在表中的位置空间是确定的,指针在访问只要知道首地址就可以高效获取其他数据**ii.**但在常用的可能只是所有列中的部分列的数据,可是行式数据库会自动查询所有的列,只是在客户端进行数据的过滤,会浪费大量的带宽和空间b)列式数据库的优缺点**i.**一张不规则的表(人物画像)每行属性有大量的null**ii.**类似于交错数组,只使用在特定原创 2020-06-25 22:36:13 · 445 阅读 · 0 评论 -
hadoop Mapreduce中的group by 和 join实操
背景MapReduce中提供了表连接操作,其中包括Map join、Reduce join等。group byUserinfos 实体类package com.njbdqn.cust;import org.apache.hadoop.io.WritableComparable;import java.io.DataInput;import java.io.DataOutput;import java.io.IOException;public class Userinfos impl原创 2020-06-07 16:38:22 · 700 阅读 · 0 评论 -
windows安装Hadoop配置环境变量及解决NullPointException
为了方便操作Hadoop,不需要打包将项目打包到Linux下测试,我们就把Hadoop安装在Windows下,可以直接进行测试。下载Hadoop:hadoop-2.6.0-cdh5.14.2.tar.gz解压并复制文件夹路径配置环境变量新建系统变量编辑环境变量Path由于我们不需要用到核心,不配置其核心文件但是到这里并不会解决空指针问题,我们还需要下载二个文件:hadoop.dll和winutils.exe需要与hadoop版本对应。...原创 2020-06-04 16:41:35 · 356 阅读 · 0 评论 -
Hadoop图解MapReduce并实现WordCount示例分析
MapReduce实现WordCount1、spliting :Documents会根据切割规则被切成若干块,2、map阶段:然后进行Map过程,Map会并行读取文本,对读取的单词进行单词分割,并且每个词以键值对<key,value>形式生成。例如:读取到”Hello World Hello Java“,分割单词形成Map.<Hello,1> <World,1><Hello,1> <Java,1>3、Combine阶段:接下来Comb原创 2020-06-04 16:07:31 · 531 阅读 · 0 评论 -
Hadoop 伪分布模式安装及环境变量
一、安装下载Hadoop解压Hadooptar -zxf hadoop-2.6.0-cdh5.14.2.tar.gz将解压后的Hadoop移动到soft,并重新命名为hadoop260mv hadoop-2.6.0-cdh5.14.2 soft/hadoop260跳蛙一般会在opt下创建一个soft,专门存放解压后的软件。二、配置需要的文件和环境变量接下来输入命令进入cd soft/hadoop260/etc/hadoop并查询jdk的路径,并复印ecoh $JAVA_HOME原创 2020-06-01 19:16:35 · 203 阅读 · 0 评论 -
大数据之hadoop入门
一、hadoop是什么hadopp是一个开源分布式系统架构,处理海量数据的架构首选,非常快得完成大数据计算任务,已发展成为一个Hadoop生态圈二、Hadoop能做什么擅长日志分析,Facebook就用hive来进行日志分析,2009年时Facebook就有非编程人员的30%的人使用HiveQL进行数据分析,淘宝搜索中的自定义筛选也使用的Hive。三、 Hadoop的核心1、HDFS:Hadoop Distributed File System 分布式文件系统–解决大数据存储2、YARN:Ye原创 2020-06-01 18:31:35 · 227 阅读 · 0 评论