
hadoop
Claroja
这个作者很懒,什么都没留下…
展开
-
hadoop hdfs 集群配置
2、修改配置文件要点提示 核心配置参数:指定hadoop的默认文件系统为:hdfs指定hdfs的namenode节点为哪台机器指定namenode软件存储元数据的本地目录指定datanode软件存放文件块的本地目录hadoop的配置文件在:/root/apps/hadoop安装目录/etc/hadoop/修改hadoop-env.sh,配置java环境变量export JA...原创 2019-03-14 20:54:42 · 493 阅读 · 0 评论 -
hdfs shell
5、hdfs的客户端操作hdfs的客户端有多种形式:1、网页形式2、命令行形式客户端在哪里运行,没有约束,只要运行客户端的机器能够跟hdfs集群联网配置文件的切块大小和存储的副本数量上面两个参数应该配置在客户端机器的hadoop目录中的hdfs-site.xml中配置<property><name>dfs.blocksize</name&原创 2019-03-14 20:55:21 · 138 阅读 · 0 评论 -
hdfs和日志业务系统
原创 2019-03-14 20:55:59 · 250 阅读 · 0 评论 -
hadoop 文件介绍
`-- hadoop-2.8.1 |-- bin |-- etc |-- include |-- lib |-- libexec |-- logs |-- sbin `-- share./hadoop-2.8.1/share|-- doc| `-- hadoop`-- hadoop |-- common # 公...原创 2019-03-14 20:56:37 · 218 阅读 · 0 评论 -
hdfs java api读写
package hdfs24;import java.io.IOException;import java.net.URI;import java.net.URISyntaxException;import java.util.Arrays;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs...原创 2019-03-14 20:57:58 · 243 阅读 · 0 评论 -
hadoop 配置文件
core-default.xmlhdfs-default.xmlmapred-default.xmlyarn-default.xmlcore-default.xml在hadoop-common-2.8.1.jar包里参数默认值描述fs.defaultFSfile:///默认是本地文件hdfs-default.xmlhadoop-hdfs-2.8.1.j...原创 2019-03-20 22:58:36 · 165 阅读 · 0 评论 -
hadoop 集群常见问题
1Invalid resource request, requested memory < 0, or requested memory > max configured, requestedMemory=1536, maxMemory=1024 conf.set("yarn.scheduler.maximum-allocation-mb","200"); conf.set("y...原创 2019-03-20 23:01:45 · 1116 阅读 · 0 评论 -
hadoop Idea 提交任务到集群
package WordCount;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.m...原创 2019-03-20 23:02:40 · 282 阅读 · 0 评论 -
virtualbox 网络配置
1.在全局配置里设定网络基本配置默认网关是10.0.2.02.给虚拟机单独设置原创 2019-03-14 20:50:13 · 2026 阅读 · 0 评论 -
hadoop hdfs 集群模板机配置
模板机配置1.配置主机名vi /etc/sysconfig/network如果有显示不正常,用以下命令# sysctl kernel.hostname=master2.配置域名映射vi /etc/hosts192.168.43.11 master edu-master192.168.43.12 slave1 edu-slave1192.168.43.13 slave2 edu-s...原创 2019-03-14 20:48:38 · 207 阅读 · 0 评论 -
hadoop集群部署
配置用户设置新账户<登录配置>useradd hadoop passwd hadoop设置ip<登录配置>vim /etc/sysconfig/network-scripts/ifcfg-eth0BOOTPROTO=static //静态地址ONBOOT=yes //开机启动IPADDR=192.168.0.101 //ip地址,不同的机器配不同的ipNETMASK=255.255.255.原创 2017-09-18 15:01:15 · 540 阅读 · 0 评论 -
mapreduce
总流程1.首先启动MRAppMaster,根据job的描述信息,计算所需要的maptask的数量,向集群请求启动maptask 2. 通过定义的map()方法将数据处理成mapTaskmaptask的数量默认是由待处理数据的逻辑切片决定,每个逻辑切片对应一个maptask。 切片的大小默认等于block的大小,切片的时候部考虑数据整体,而是分别对每一个文件进行单独的切片。例如 文件1 大小为1原创 2017-10-12 14:30:28 · 312 阅读 · 0 评论 -
HDFS
HDFS上传文件1 客户端:向namenode请求上传文件,请返回批准 1 namenode:可以上传 2 客户端:请求上传第一个block(0-128M),请返回datenode 2 namenode: 综合考虑空间/距离,返回若干datenode(dn1,dn2,dn4)。 3 客户端:向dn1请求建立block传输通道channel,并让dn1和dn2,dn4建立channel 3原创 2017-10-12 09:57:15 · 328 阅读 · 0 评论 -
HIVE
目标不同,设计需求就不同 业务仓库需要考虑三范式 数据仓库不用三范式,用宽表,以空间换时间星型模型 把所有事实放在一个表里面,关联维度力度表hive是局域hadoop的一个数据仓库,将结构化的数据文件映射为一张数据表,提供SQL查询功能,封装了mapreduce HIVE将SQL语言编译为MapReduce,然后放在YARN里面执行 MySQL里面存储的是HIVE的配置信息,比如字段之间原创 2017-10-13 10:33:31 · 1010 阅读 · 2 评论 -
hadoopstreaming
设置key-value的分隔符-D stream.map.output.field.separator=. -D stream.num.map.output.key.fields=4 第4个”.”之前的是key,之后的是value,如果”.”小于4个则全部为key,value为空通用的配置文件既-D的参数property>name>mapred.job.namename翻译 2017-09-28 15:00:32 · 374 阅读 · 0 评论 -
hadoop
VirtualBox安装centos6.5原创 2017-09-15 11:43:58 · 528 阅读 · 0 评论 -
Hbase
面向行数据库 事务型 面向列数据库 分析型Hbase和SQL的区别 特点 Hbase SQL 存储的数据类型 存储为字节 各种数据类型,比如int,char 数据操作 没有多表连接 有多表连接 存储模式 基于列存储 基于行存储 数据索引 只有一个索引—行健 可对不同列构建多个索引 数据维护 添加新值会覆盖旧值 添加新值,会原创 2017-10-16 12:43:33 · 380 阅读 · 0 评论 -
hadoop 概要
处理海量数据的核心技术:海量数据存储:分布式海量数据运算:分布式存储框架:HDFS——分布式文件存储系统(HADOOP中的存储框架)HBASE——分布式数据库系统KAFKA——分布式消息缓存系统(实时流式数据处理场景中应用广泛)运算框架:(要解决的核心问题就是帮用户将处理逻辑在很多机器上并行)MAPREDUCE—— 离线批处理/HADOOP中的运算框架SPARK —— 离线批处理...原创 2019-03-14 20:46:51 · 319 阅读 · 0 评论 -
hadoop linux 集群提交任务
jobcommitpackage WordCount;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Text;import org.apach...原创 2019-03-20 23:03:20 · 819 阅读 · 0 评论