
hadoop
Stefanboy
工作 技术 java 分享
展开
-
yarn资源调优参数&yarn的调度器&yarn的常用命令
yarn资源调优参数概念介绍container是一个虚拟化的容器,包括memory和vcore两个维度,作用是运行appmaster和task任务物理核pcore服务器上实际的物理CPU的核数虚拟核vcoreyarn引入的一个概念,设计的初衷是考虑到每台服务器的性能不一样,比如某一个物理CPU是另一个物理CPU的两倍,通过设置pcore和vcore来弥补这种差距比如第一台机器CP...原创 2019-12-14 17:53:03 · 1196 阅读 · 2 评论 -
MR架构&文件格式优缺点&压缩格式优缺点&spilt -> map task关系&wordcount&shuffle的理解
MapReduce是什么mapreduce分为map阶段和reduce阶段map阶段是映射 生产上可以对于此进行调优,比如合并小文件reduce阶段是聚合 生产上默认是生成1个文件mr2.x架构设计(mr on yarn 流程)Yarn介绍yarn包括RM和NMRMRM包括两部分1、applications Manager 应用程序管理器2、resoure schedule ...原创 2019-12-10 23:09:05 · 558 阅读 · 1 评论 -
DataNode抛内存溢出oom的error
CDH查看DataNode的内存情况DataNode报错信息2017-12-17 23:58:14,422 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: PacketResponder: BP-1437036909- 块大小为什么要设置成128M?(参考其他人的博客)是为了最小化寻址时间,目前磁盘的传输速率普遍是...原创 2019-12-03 11:32:27 · 552 阅读 · 0 评论 -
YARN部署&jps&Linux的oom及过期清理
YARN部署使用yarn伪分布式部署,主从架构切换hadoop用户 [root@JD ~]# su - hadoop Last login: Sun Dec 1 15:09:50 CST 2019 on pts/0配置mapred-site.xml 进入hadoop目录下 [hadoop@JD ~]$ cd app/hadoop/etc/hadoop 修...原创 2019-12-03 11:24:38 · 464 阅读 · 0 评论 -
配置ssh&HDFS部署使用&如何保证数据质量(数据重刷机制)&官网参数
安装配置jdk、hosts、ssh安装配置jdk上传tar.gz包[root@JD /]# cd /usr/java[root@JD java]# lltotal 355840drwxr-xr-x 8 root root 4096 Nov 17 00:24 jdk1.8.0_121-rw-r--r-- 1 root root 191100510 Nov 14 01:25 j...原创 2019-12-03 11:20:57 · 564 阅读 · 0 评论