
随笔
enoughgood
一条道走到黑
展开
-
Maven项目中引入Guava依赖
<!-- https://mvnrepository.com/artifact/com.google.guava/guava --> <dependency> <groupId>com.google.guava</groupId> <artifactId>guava</artifactId> <version>22.0&l...原创 2021-11-16 16:56:22 · 11013 阅读 · 0 评论 -
Hive实现获取指定月的第一天和最后一天
--指定月的第一天select trunc('2020-11-10','MM');2020-11-01--指定月的最后一天select last_day('2020-11-10');2020-11-30原创 2021-11-09 14:07:54 · 6437 阅读 · 0 评论 -
源码编译Kylin(详细版)
1. 在阿里云ECS上源码编译Kylin1.1 编译前准备 在Kylin源码编译过程中有不少坑,报各种错.为了减少报错信息,需要提前对编译环境做一些准备.安装Maven(版本在3.5.3及以上)#1.解压安装包[root@linux122 software]# tar -zvxf apache-maven-3.6.3-bin.tar.gz -C /opt/servers#2.配置maven环境变量[root@linux122 software]# vim /etc/profile#MA原创 2021-09-29 10:34:42 · 1602 阅读 · 0 评论 -
原生Hadoop环境下安装Hue
1. 写在前面的话 从事大数据开发已经有几年了,最近工作遇到瓶颈,时下火热的技术用的不多,想再提升提升.经过对方对比,详细了解了拉勾的课程体系,觉得是比较适合自己的,所以最后选择了拉勾教育大数据高薪训练营.现对学习内容以及结合自身的工作经验做一些总结.2. Hue的编译安装2.1 hue相关的网址Hue官方网站Hue官方用户手册官方安装文档HUE下载地址2.2 安装说明 由于官方没有提供编译好的软件包,所以这里需要自己下载源码,安装依赖,编译安装.安装Hue的节点上最好没有安装过MyS原创 2020-09-06 18:27:31 · 633 阅读 · 0 评论 -
HiveSQL常用优化方法经验总结
1. 写在前面的话从事大数据开发已经有几年了,最近工作遇到瓶颈,时下火热的技术用的不多,想再提升提升.经过对方对比,详细了解了拉勾的课程体系,觉得是比较适合自己的,所以最后选择了拉勾教育大数据高薪训练营.现对学习内容以及结合自身的工作经验做一些总结,也算是开启自己的博客之路.2. Hive中解决数据倾斜的场景2.1 大表Join小表时的数据倾斜(map join) 在大表Join小表时,解决数据倾斜最好的方式是使用Map Join,避免Shuffle,从而也避免了数据倾斜. map join主要通原创 2020-09-06 17:43:19 · 1370 阅读 · 1 评论 -
阿里云ECS服务器下安装MySQL
1. 写在前面的话 从事大数据开发已经有几年了,最近工作遇到瓶颈,时下火热的技术用的不多,想再提升提升.经过对方对比,详细了解了拉勾的课程体系,觉得是比较适合自己的,所以最后选择了拉勾教育大数据高薪训练营.现对学习内容以及结合自身的工作经验做一些总结,也算是开启自己的博客之路.2. 安装MySQL的前置条件2.1 安装环境说明 这里安装选用的Linux系统的版本为CentOS7.5,MySQL的版本为MySQL5.7.26,在阿里云ECS服务器上进行安装.2.2 删除CentOS7.x自带的M原创 2020-09-06 15:03:57 · 541 阅读 · 0 评论 -
原生Hadoop环境下Impala的安装和使用
1. Impala的基本概念1.1 什么是Impala Impala就是使用SQL语句来操作Hive中的数据库和表,它可以提供低延迟的交互式的SQL查询功能.它与Hive共用表的元数据信息,所以需要使用Impala必须要先有Hive.1.2 Impala的优缺点以及使用场景优点:基于内存计算,不需要把中间结果写入磁盘,省掉了大量的I/O开销.无需将SQL转换为MapReduce任务,可以直接访问存储在HDFS,HBASE中的数据进行作业调度,可以提高查询速度.使用了支持数据本地化的I/O调原创 2020-09-06 14:17:48 · 3316 阅读 · 12 评论 -
Linux下查看某个文件夹下的所有文件个数
ll | grep "^-" | wc -l原创 2020-11-18 16:06:07 · 543 阅读 · 0 评论 -
在Hive中根据起止日期生成连续的日期
格式:with dates as( select date_add(start_date, a.pos) as d from (select posexplode(split(repeat("m", datediff(end_date, start_date)), "m"))) a)select * from dates;使用方式: 将start_date和end_date替换为自己的日期即可.案例:with dates as( select date_add("202原创 2020-11-18 16:00:51 · 3622 阅读 · 2 评论 -
Apache所有组件下载地址(包括官方地址和国内清华镜像)
点击链接原创 2020-10-31 17:49:15 · 2782 阅读 · 0 评论 -
CentOS7.x国内镜像下载地址
清华大学开源镜像原创 2020-10-30 14:36:04 · 4076 阅读 · 0 评论 -
DataGrip所有版本下载地址
下载地址原创 2020-10-27 18:33:02 · 7060 阅读 · 0 评论 -
将Hive的执行引擎更换为Tez
将Hive的执行引擎更换为Tez1.1 集群环境CentOS7.xJDK1.8hadoop2.7.2hive2.3.7tez-0.9.2hiveserver2,metastore和tez都安装在hadoop102上1.2 操作步骤1.2.1 下载并解压Tez安装包下载地址https://mirrors.bfsu.edu.cn/apache/tez/0.9.2/解压#HiveServer2在哪个节点就解压到哪个节点[root@hadoop102 software]$ ta原创 2020-10-27 16:50:28 · 1822 阅读 · 2 评论