- 博客(3)
- 收藏
- 关注
原创 在PostgreSQL 和 Hive中生成日期序列
在PostgreSQL 和 Hive中生成日期序列 Postgresql实现日期序列 在postgresql中,有 generate_series(start_date, end_date, interval)函数来生成日期序列 select date(day) as day from generate_series('2020-05-22'::timestamp, current_date, '1 day'::interval) as day Hive实现指定指定开始结束日期的日期序列 在Hive中,
2020-06-30 23:40:15
1240
原创 Hive 创建不同压缩方式的ORC存储格式表
目录 创建一个非压缩的的ORC存储方式表 创建一个snappy压缩的ORC存储方式表 创建一个ZLIB压缩的ORC存储方式表(默认方式) 存储方式和压缩总结 使用压缩的优势是可以最小化所需要的磁盘存储空间,以及减少磁盘和网络io操作 ORC支持三种压缩:ZLIB,SNAPPY,NONE。最后一种就是不压缩,orc默认采用的是ZLIB压缩。 创建一个非压缩的的ORC存储方式表 create table log_orc_none ( track_time string, url
2020-06-29 14:57:49
3099
1
原创 安装伪分布式Hadoop (Mac OS X)
目录 Hadoop安装配置介绍 伪分布式Hadoop安装 1.安装Java JDK 2. SSH 配置 3. 安装Hadoop 官网下载 HDFS配置 4.添加Hadoop环境变量 5.运行Hadoop + 查看远端 格式化一个新的分布式文件系统DFS(即对namenode初始化) 启动dfs文件系统(开启保护进程) 查看远端(Hadoop端口) 关闭伪分布式 6...
2019-04-22 00:36:56
974
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅