
Yarn
XiaoGuang-Xu
主要从事Hadoop Spark Flink,兴趣爱好:数据挖掘和机器学方向
展开
-
学习资料
学习资料hadoop2(5)hive(3)Think in Java(7)设计模式(4)Mapreduce(2)Shell(0)其它(5)JVM(8)hadoop(23)数据结构与算法(21)Linux(4)http://my.oschina.net/u/1464779/blog?catalog=538680原创 2015-02-11 13:11:08 · 612 阅读 · 0 评论 -
Big-Data-Resources
#大数据/数据挖掘/推荐系统/机器学习相关资源Share my personal resources ##书籍* 各种书~各种ppt~更新中~ * 机器学习经典书籍小结 * 机器学习&深度学习经典资料汇总 #视频* 浙大数据挖掘系列 * 用Python做科学计算 * R语言视频原创 2017-02-13 17:19:22 · 17594 阅读 · 0 评论 -
使用process_monitor.sh监控hadoop进程的crontab配置
使用process_monitor.sh监控hadoop进程的crontab配置 可以从下列链接找到process_monitor.sh:https://github.com/eyjian/mooon/blob/master/common_library/shell/process_monitor.sh------------------------------------转载 2017-04-10 12:14:43 · 896 阅读 · 2 评论 -
Hadoop YARN常见问题以及解决方案
作者:Dong | 新浪微博:西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明网址:http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-problems-vs-solutions/本博客的文章集合:http://dongxicheng.org/recommend/本文汇总了几个hadoop转载 2017-03-16 11:41:19 · 669 阅读 · 0 评论 -
CDH5.5启动Yarn的NodeManager报错
原创 2017-04-12 22:27:46 · 1227 阅读 · 0 评论 -
MapReduce On YARN的工作原理
MapReduce On YARN MapReduce计算框架将计算过程分为两个阶段:Map和Reduce Map阶段并行处理输入数据; Reduce阶段对Map结果进行汇总Shuffle连接Map和Reduce两个阶段 Map Task将数据写到本地磁盘; Reduce Task从每个Map Task上读取一份数据;仅适合离转载 2017-06-08 10:59:11 · 832 阅读 · 0 评论 -
Yarn & Mapreduce 配置参数总结
尊重原创,拒绝转载 原文地址:http://blog.youkuaiyun.com/stark_summer/article/details/48494391配置设置nodemanager 总内存大小为32G,在yarn-site.xml 增加如下内容:property> name>yarn.nodemanager.resource.memory-mbname>转载 2017-02-06 10:25:44 · 496 阅读 · 0 评论 -
Yarn基本架构
YARN角色1.RM ResourceManager a)调度器:分配container给应用程序b)应用程序管理器:管理应用程序(程序提交,与调度器交互启动AM,监控AM等)2.ApplicationMaster:管理每个应用程序,与RM交互要container,与NM交互运行task3.NodeManager:运行应用程序AM的task,与RM交互汇报C转载 2015-05-20 10:59:35 · 515 阅读 · 0 评论 -
Hadoop2中ResourceManager的HA
hadoop2中ResourceManager的HA 大家都知道在hadoop2中对HDFS的改进很大,实现了NameNode的HA;也增加了ResourceManager。但是ResourceManager也可以实现HA。你没看错,确实是ResourceManager的HA。注意是在Apache Hadoop 2.4.1版本中开始加入的,可不是任意一个版本。我们不讲单转载 2015-04-02 16:23:16 · 606 阅读 · 0 评论 -
MapReduce运行中遇到的问题
1:运行mapreduce任务任务过程中,出现下面现象,为啥? TaskAttempt killed because it ran on unusable nodehadoopserver13:8041 Container released on a *lost* node YARN error: TaskAttempt killed because it ran on unusab原创 2017-05-17 10:26:26 · 2514 阅读 · 0 评论 -
NodeManager启动报错
Nodeemanager异常 org.fusesource.leveldbjni.internal.NativeDB$DBException: Corruption: checksum mismatch系统环境:ubuntu14.04 server cloudera CDH 5.10 共计28个节点。单节点内存128G。有6台机器是24核,22台机器是32核。有10台机器磁转载 2017-10-26 10:41:41 · 1502 阅读 · 0 评论 -
CDH集群调优:内存、Vcores和DRF
CDH集群调优:内存、Vcores和DRF原文 http://blog.selfup.cn/1631.html吐槽最近“闲”来无事,通过CM把vcores使用情况调出来看了一眼,发现不论集群中有多少个任务在跑,已分配的VCores始终不会超过120。而集群的可用Vcores是360(15台机器×24虚拟核)。这就相当于CPU资源只用到了1/3,作为一个半强转载 2016-11-15 18:17:20 · 799 阅读 · 0 评论 -
Yarn最佳实践
Yarn最佳实践转载:http://blog.youkuaiyun.com/jiangshouzhuang/article/details/52595781本篇博客,我将讨论Yarn资源管理方面的最佳实践,如果有写的不对的地方,请朋友们多多指教。本篇文章也参考了网上的一些资料。 Hadoop2中引入Yarn组件,将MRv2(Yarn)分为两个主要组件,一个是资源管理,一个是作业转载 2016-11-02 18:07:43 · 1321 阅读 · 0 评论 -
Hadoop 新 MapReduce 框架 Yarn 详解
Hadoop 新 MapReduce 框架 Yarn 详解https://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/转载 2015-01-06 16:50:22 · 583 阅读 · 0 评论 -
更快、更强——解析Hadoop新一代MapReduce框架Yarn
更快、更强——解析Hadoop新一代MapReduce框架Yarn转载URL: http://www.youkuaiyun.com/article/2014-02-10/2818355Yarn架构Yarn/MRv2最基本的想法是将原JobTracker主要的资源管理和job调度/监视功能分开作为两个单独的守护进程。有一个全局的ResourceManager(RM)和每个Ap转载 2015-02-11 10:47:09 · 611 阅读 · 0 评论 -
YARN的 Resource Manager的作用
可以带着下面问题来阅读本文:1.YARN通过什么来负责管理和分配集群中资源?2.ResourceManager有几部分组成?3.管理员通过什么服务来管理集群?4.集群默认多长时间未汇报心跳,则认为其死掉?5.ApplicationACLsManager有几种权限,查看主要查看什么,修改,主要修改什么?6.ResourceScheduler在YARN中的位置?1:在Y转载 2015-04-02 16:47:07 · 1908 阅读 · 0 评论 -
HDFS HA和Federation安装部署方法
HDFS HA和Federation安装部署方法相比于Hadoop1.0,Hadoop 2.0中的HDFS增加了两个重大特性,HA和Federaion。HA即为High Availability,用于解决NameNode单点故障问题,该特性通过热备的方式为主NameNode提供一个备用者,一旦主NameNode出现故障,可以迅速切换至备NameNode,从而实现不间断对外提供服务。Federa转载 2015-04-02 16:41:39 · 778 阅读 · 0 评论 -
YARN的工作流程
YARN的工作流程hadoop数据mapreduceyarn工作流1、用户向YARN中提交应用程序,其中包括ApplicationMaster(AM)程序,启动AM的命令,用户程序等。2、ResourceManger(RM)为该程序分配第一个Container,并与对应的NodeManger通讯,要求它在这个Container中启转载 2015-05-20 10:00:37 · 806 阅读 · 0 评论 -
Hadoop和大数据:60款顶级开源工具
2015-08-10 优快云大数据说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会转载 2015-08-10 18:34:14 · 2180 阅读 · 0 评论 -
大数据学习博客
博客网址:http://blog.youkuaiyun.com/stark_summer/article/category/2816307原创 2016-05-18 09:19:36 · 638 阅读 · 0 评论 -
CDH安装中的一些问题及解决方法
导读:本文对一些遇到异常总结,如果遇到了,能解决更好,如果还没有遇到,可以备用。1.yarn无法启动,可能原因是什么?2.Host Monitor和Service Monitor服务无法启动,可能造成的原因是什么?3.oozie服务启动失败本文是如何解决的?Yarn服务无法启动1有一次同事拿着我写的安装手册去安装CDH,结果在启动Yarn服务这一转载 2016-06-02 14:21:45 · 2097 阅读 · 0 评论 -
YARN内存使用优化配置
YARN内存使用优化配置时间 2014-05-30 17:02:07 ITeye-博客原文 http://jeyke.iteye.com/blog/2074345主题 YARN在Hadoop2.0中, YARN负责管理MapReduce中的资源(内存, CPU等)并且将其打包成Container. 这样可以精简MapReduce, 使之专注于其擅长的数据处理转载 2016-06-17 14:26:30 · 365 阅读 · 0 评论 -
Hadoop错误笔记
1: 错误一:重启agent2:export HADOOP_DATANODE_OPTS="-Xmx26214m -Xms256m -Dcom.sun.management.jmxremote $HADOOP_DATANODE_OPTS"2016-09-07 17:54:32,496 INFO [fetcher#2] org.apache.hadoop.mapre原创 2016-11-04 10:56:01 · 1192 阅读 · 0 评论 -
NodeManager异常 错误
由于服务器宕机,造成NodeManager很久没有启动服务,当再次启动服务时,出现下面问题:错误1:错误2:原创 2017-10-26 10:44:29 · 757 阅读 · 0 评论