自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 用Tez替换MR作为Hive的计算引擎

用Tez替换MR作为Hive的计算引擎一、安装包准备(1)下载tez的依赖包:http://tez.apache.org2)(2)解压安装包apache-tez-0.9.1-bin.tar.gz二、在Hive中配置Tez(1)进入到Hive的配置目录:/opt/module/hive/conf(这是我的路径,根据自己的安装路径去找)(2)在hive-env.sh文件中添加tez环境变量...

2019-08-24 21:30:46 1376

原创 Spark RDD的五大特性及Spark常用算子说明

Spark RDD的五大特性及Spark常用算子说明一、RDD的五大特性1.a list of partiotioner有很多个partiotioner(这里有3个partiotioner),可以明确的说,一个分区在一台机器上,一个分区其实就是放在一台机器的内存上,一台机器上可以有多个分区。2.a function for partiotioner一个函数作用在一个分区上。比如说一个分区有1...

2019-08-24 20:50:57 587

原创 MySQL5.1.73版本的安装

MySQL5.1.73版本的安装1.查看mysql是否安装,如果安装了,卸载mysql (1)查看[root@hadoop102 桌面]# rpm -qa|grep mysqlmysql-libs-5.1.73-7.el6.x86_64 (2)卸载[root@hadoop102 桌面]# rpm -e --nodeps mysql-libs-5.1.73-7.el6.x86_642....

2019-08-24 19:47:02 2404 1

原创 spark中rdd分区数量的决定因素

spark中rdd分区数量的决定因素1、参数配置(并行度)分区的默认个数等于对spark.default.parallelism的指定值2、根据父rdd的reduceTask数量3、读取hdfs的文件生成的rddrdd分区的数量等于hdfs的文件的block4、sparkStreaming生成的rdd根据block interval,batch interval的时间决定defau...

2019-08-24 19:10:30 2272 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除