自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Apache sqoop简单使用介绍

文章目录介绍安装及配置导入全量导入全量导入到HDFS全量导入到HIVE子集导入where过滤query查询增量导入append模式lastmodified模式append选项merge-key选项导出默认模式导出更新导出updateonlyallowinsertsqoop job作业创建job查看job查看job详细信息执行job免密执行job介绍sqoop是RDBMS(mysql,oracl...

2019-10-18 17:25:38 915

原创 Hadoop mapreduce中自定义排序及自定义分组

一、map自定义排序哪个字段需要排序,将其设为map输出的key,利用map的排序完成。如果字段为基本类型且正序排序,则直接设为key,利用map默认排序即可。如果字段为对象或需要倒序排序,则需利用对象类实现comparable(WritableComparable)接口,重写接口的comparable方法。二、map自定义分组需新建分组类,继承WritableComparator类...

2019-10-09 16:19:26 1124

原创 HADOOP集群搭建

1. 集群简介Hadoop包括两个集群,hdfs集群和yarn集群hdfs集群负责数据存储,主要角色有:NameNode,DataNode,SecondaryNameNodeyarn集群负责调度管理,主要角色有ResourceManager, NodeManager两者逻辑上没有必要关联一定要放在一起,但一般放在一起。2. 环境准备centOS/VMWare开启三台虚拟机bigdat...

2019-09-25 21:16:49 223

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除