
Hadoop
860MHz
这个作者很懒,什么都没留下…
展开
-
Hadoop Filesystem 多次close的问题
多线程并发调用org.apache.hadoop.fs.FileSystem.close() 可能导致其他线程java.io.IOException: Filesystem closed at org.apache.hadoop.hdfs.DFSClient.checkOpen(DFSClient.java:565) at org.apache.hado原创 2015-08-28 10:35:00 · 3403 阅读 · 0 评论 -
pig JOIN 的replicated后标
PIG 在2个表JOIN的时候,如果使用Using 'replicated' 会将后面的表分段读到内存中,从而加快JOIN的效率。但是如果load 到内存的数据超过JVM的限制就会报错==>java.lang.OutOfMemoryError: Java heap space原创 2015-12-29 20:20:31 · 488 阅读 · 0 评论 -
pig mysql 写法比较
1.从文件导入数据 1)Mysql (Mysql需要先创建表). CREATE TABLE TMP_TABLE(USER VARCHAR(32),AGE INT,IS_MALE BOOLEAN); CREATE TABLE TMP_TABLE_2(AGE INT,OPTIONS VARCHAR(50));转载 2015-12-29 20:24:01 · 467 阅读 · 0 评论 -
Hadoop Yarn内存资源隔离实现原理——基于线程监控的内存隔离方案
注:本文以hadoop-2.5.0-cdh5.3.2为例进行说明。Hadoop Yarn的资源隔离是指为运行着不同任务的“Container”提供可独立使用的计算资源,以避免它们之间相互干扰。目前支持两种类型的资源隔离:CPU和内存,对于这两种类型的资源,Yarn使用了不同的资源隔离方案。对于CPU而言,它是一种“弹性”资源,使用量大小不会直接影响到应用程序的存亡,转载 2016-02-01 14:43:16 · 3525 阅读 · 0 评论