自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 Hive底层优化

博客地址: https://hortonworks.com/blog/100x-faster-hive/ https://hortonworks.com/blog/orcfile-in-hdp-2-better-compression-better-performance/ https://hortonworks.com/blog/5-ways-make-hive-queries-run-faster/ 五个调优hive的建议: 1.使用TEZ引擎 使用TEZ引擎代替原有的MR引擎,提高计算速度(什么是TE

2021-03-24 01:51:28 293

原创 CDH5集群配置lzo

一、安装lzo 1、下载与集群版本相对应的parcel包 parcels下载 我CDH版本是5.11.0,所以下载如下三个文件 [root@hadoop002 lzo]# ll total 2440 -rw-r--r-- 1 root root 2476671 Jan 12 10:24 GPLEXTRAS-5.11.0-1.cdh5.11.0.p0.30-el6.parcel -rw-r--r-- 1 root root 41 Jan 12 10:23 GPLEXTRAS-5.11.0-1.cdh

2021-03-24 01:42:38 271

原创 集群迁移采坑记

1.Clouder Manager 集群迁移 迁徙前先停止服务,停止顺序如下: 先在界面上停止CM以及各个组件的服务 停止CM 停止Hadoop组件服务 停止机器上的cloudera-scm-server/db/agent service 先停止cloudera-scm-server 上的服务 service cloudera-scm-sever-db stop sevice cloudera-scm-server stop service cloudera-scm-agent stop 停止每台cli

2021-03-24 01:37:17 242

原创 CDH集群中关于HBase的优化

1.   垃圾回收优化 1)首先是设置新生代大小的参数,不能过小,过小则导致年轻代过快成为老生代,引起老生代产生内存随便。同样不能过大,过大导致所有的JAVA进程停止时间长。-XX:MaxNewSize=256m-XX:NewSize=256m这两个可以合并成为-Xmn256m这一个配置来完成。 2)其次是设置垃圾回收策略:-XX:+UseParNewGC -XX:+UseConcMarkSw

2017-10-13 13:43:57 8668

原创 SQL优化心得

索引相关: 1.尽量不用null判断,因为null的话会全表遍历,而不是使用索引,如果是字符串可以  >’',id可以>0 2.避免在where条件用or,如果一个有索引一个没有可以分开查用union,否则会变成全表查询 3.有些情况可以用exists替换in,exists会先循环外部,在查子查询,in 是做hash连表查询,如果外部表比子查询的表小很多,exists会比较快

2017-10-11 11:18:56 666

原创 Postgresql如何使得查询语句输出到文件

文本 查询结果输出到文件: \o /tmp/a.txt select * from table; \o 导出成csv COPY (select * from table) to '/u02/tmp/tmp.csv' with csv header;

2017-10-11 10:34:13 4491

原创 Postgresql的数据迁移

postgresql数据库改变data目录 文档 例:把目录改变至/data中 0.准备工作 停掉 pg server   service postgresql stop 1.修改配置文件/etc/postgresql/9.3/main/postgresql.conf (记得备份)     data_directory = '/data/postgresq

2017-10-11 10:32:33 871

原创 Postgresql的语句学习

1.对时间的操作: 在PostgreSQL中可以直接对时间进行加减运算:、 SELECT now()::timestamp + '1 year';  --当前时间加1年 SELECT now()::timestamp + '1 month';  --当前时间加一个月 SELECT now()::timestamp + '1 day';  --当前时间加一天 SELEC

2017-10-11 10:28:46 313

原创 如何源码编译Livy

首先下载Livy 前置条件: Xcode command line toolsOracle's JDK 1.7+Maven (Homebrew)Python 2.6+R 3.xLivy requires at least Spark 1.6 and supports both Scala 2.10 and 2.11 builds of Spark, Livy will automatica

2017-10-10 20:02:28 1889

原创 如何源码编译对应CDH版本的Spark2.X

前置要求: 1)Building Spark using Maven requires Maven 3.3.9 or newer and Java 7+ 2)export MAVEN_OPTS="-Xmx2g -XX:ReservedCodeCacheSize=512m" mvn编译命令: ./build/mvn -Pyarn -Phadoop-2.4 -Dhadoop.versi

2017-10-10 19:52:50 2168

原创 如何源码编译zeppelin

1.下载源码包 git clone https://github.com/apache/zeppelin.git 2.编译对应的CDH的版本 mvn clean package -Pspark-1.6 -Dhadoop.version=2.6.0-cdh5.11.0 -Pyarn -Ppyspark -Phadoop-2.6 -Pvendor-repo -DskipTests 3.编译ze

2017-10-10 19:49:44 1747

原创 基于Ubuntu环境下的CM+kylin搭建

本次采用离线安装的方式 软件准备: 官方安装文档:http://www.cloudera.com/documentation/enterprise/5-6-x/topics/installation.html  相关包的下载地址:  Cloudera Manager地址:http://archive.cloudera.com/cm5/cm/5/ 这里选择5.5.6 cloudera

2017-10-10 18:12:40 582

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除