
数据仓库hive
文章平均质量分 93
会飞的boy
期待我们的改变
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
部署分布式SQL查询引擎框架(presto)
0. 背景 在了解到公司已经使用多数据源的情况下,同时要满足bi报表(web 报表展示平台)的后台数据库的连接支持 ,所以 准备调研并搭建presto 服务框架 1.简介 一.Presto是一个facebook开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。presto的架构由关系型数据库的架构演化而来。 其本身并不存储数据,但是可以接入多种数据源,并且支持跨数据源的级联查询。Presto是一个OLAP的工具,擅长对海量数据进行复杂的分析;但...原创 2021-02-21 14:08:11 · 997 阅读 · 0 评论 -
安装 hive 的客户端---hue
一. 搭建流程: 搭建的流程,其实是根据 官方文档的提示进行操作的, 官方文档的链接: https://github.com/cloudera/hue/tree/release-4.8.0 ,这里我选择的是实体机器的搭建方式 ,若想使用其他方式详情见git 的详细操作 从官方文档的搭建步骤过程中,其实主要分为以下几步: 一. 检查系统的 环境以及安装系统的插件 二. 下载源码,进行源码编译安装 三. 进行启动测试调试 四. 与集群的...原创 2021-02-18 19:38:56 · 1290 阅读 · 0 评论 -
使用beeline 连接客户端报错
当hive数据仓库搭建起来了,同时将hiveserver2 服务器端已启动(命令:./hiveserver2) ,使用 beeline 命令启动客户端 报一下这个错误: Beeline version 1.2.1 by Apache Hivebeeline> !connect jdbc:hive2://192.168.173.128:10000 Connecting to jdbc:hiv原创 2018-01-02 16:16:20 · 3542 阅读 · 0 评论 -
将一个大文件进行拆分为多个小文件源码
import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileInputStream; import java.io.FileWriter; import java.io.IOException; import java.io.InputStre原创 2018-01-09 16:26:12 · 5452 阅读 · 0 评论