- 博客(7)
- 收藏
- 关注
原创 flume 数据采集
1、flume在大数据业务中的角色Hadoop业务的整体开发流程: 在大数据的业务处理过程中,Flume主要负责数据的采集。 2、Flume架构介绍 flume是分布式的日志收集系统,它将各个服务器中的数据收集起来并送到指定的地方去,比如说送到图中的HDFS,简单来说flume就是收集日志的。 2、Event 在这里有必要先介绍一下flume中event
2017-12-29 21:00:07
3330
原创 sqoop入门
大数据技术之Sqoop 一、Sqoop简介Sqoop是hdfs、hive、hbase和RDBMS结构化数据库之间传输大量数据的工具。二、Sqoop原理将导入或导出命令翻译成mapreduce程序来实现。在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。三、Sqoop安装安装Sqoop的前提是已经具备Java和Hadoop
2017-12-27 19:51:57
2279
原创 Hadoop-mapreduce reducer端多表合并
package cn.nyzc.reducejoin;import java.io.DataInput;import java.io.DataOutput;import java.io.IOException;import org.apache.hadoop.io.Writable;/** * 传输的bean对象 * Title: OrderBe
2017-12-17 14:59:17
465
原创 hadoop-mapreduce map端多表合并
package com.atguigu.mapjoin;import java.io.BufferedReader;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStreamReader;import java.util.HashMap;import jav
2017-12-17 13:06:42
902
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人