Hadoop
KNIFE_PAN
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hadoop2.5.1 集群环境部署
部署环境:Centos7.0 三台()原创 2014-09-18 10:15:04 · 1102 阅读 · 0 评论 -
hdfs dfs -du -h 输出三列数据的含义
命令 hdfs dfs -du -h /data/结果 102.3 M 307.0 M /data/第一列标示该目录下总文件大小第二列标示该目录下所有文件在集群上的总存储大小和你的副本数相关,我的副本数是3 ,所以第二列的是第一列的三倍 (第二列内容=文件大小*副本数)第三列标示你查询的目录原创 2015-03-12 10:23:09 · 36348 阅读 · 4 评论 -
hive 压缩参数
压缩考虑第一压缩率 第二压缩/解压缩时间(cpu开销)第三是否支持切分对以上三个问题说明BZip2的压缩率最高,消耗的cpu资源也最多,支持分割Gzip 的压缩率和压缩速度都还可以,如果磁盘利用率和和I/O开销都要考虑的话,是不错的选择,但是不支持分割LZO和snappy压缩率比请两个要小,但是速度很快 其中Snappy不支持分割原创 2015-03-09 15:50:29 · 1878 阅读 · 0 评论 -
Hadoop archives 说明
1.创建归档文件(会执行maprreduce)hadoop archive -archivename test.har /test/vot/ /test/har/2.查看归档文件hdfs dfs -ls -R har:///test/har/vot.harhdfs dfs -ls -R har://hdfs-dns:9000/har/vot.har(外部访问)3.说明1创原创 2015-03-09 15:07:55 · 616 阅读 · 0 评论 -
Eclipse 下搭建Hadoop(2.5.0) 开发环境 YARN
先说一下架构1.Hadoop搭建的是伪分布 版本2.5.02.Hadoop搭建在linux平台下3.Windows8 平台下安装eclipse 通过mapreduce插件链接到linux平台下的hadoophadoop 伪分布配置文件说明 (注意这是linux机器上的,windows上可以将其配置拷贝过来覆盖,也可以不配置)1.core-site.xml原创 2015-03-08 16:44:12 · 920 阅读 · 0 评论 -
生产环境下部署hadoop集群(包括dns配置,nfs共享,awk资源分发)
生产环境中部署hadoop集群与测试环境中部署的区别主要是:1.使用DNS而不是hosts来解析主机名2.使用NFS共享秘钥文件,而不是手工拷贝配置3.复制hadoop时使用脚本批量操作,而不是单个复制第一。安装环境和节点地址划分1.节点规划主机名IP地址Hadoop其他服务CLI192.168.80.100无原创 2014-10-29 15:06:23 · 2560 阅读 · 0 评论 -
Linux 64位编译hadoop源码
机器:Centos7.0 64bit 软件 hadoop: hadoop-2.5.0-cdh5.2.11.安装Linux 系统包> yum install autoconf automake libtool cmake>yum install ncurses-devel>yum install openssl-devel>yum install lzo-devel原创 2014-12-24 14:00:19 · 675 阅读 · 0 评论 -
hadoop HA集群环境配置
这里仅仅列出部分配置文件信息,供自己记录使用。1.core-site.xml hadoop.tmp.dir /home/hadoop/tmp Abase for other temporary directories. fs.defaultFS原创 2014-12-15 12:43:21 · 758 阅读 · 0 评论 -
windows下搭建hadoop开发环境
第一。安装JDK配置,jdk环境变量(这里不再赘述)第二原创 2014-10-31 15:30:51 · 726 阅读 · 0 评论 -
win7下编译生产hadoop-eclipse-plugin-2.2.0.jar
第一,首先确定你的windows也安装ant (在)原创 2014-10-31 14:44:43 · 846 阅读 · 0 评论 -
YARN Fair Scheduler 配置
1.yarn-site.xml<property> <name>yarn.resourcemanager.scheduler.class</name> <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value></property><property>原创 2015-06-08 15:23:41 · 1882 阅读 · 0 评论
分享