
Hive
刘金超DT
让数据说话,让未来透明
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hive基本介绍(一)
一、什么是HiveHive 是一种底层封装了Hadoop 的数据仓库处理工具,本质是将SQL语句通过解释器转换为MapReduce作业提交到Hadoop集群上进行计算,将结构化的数据映射为一张数据库表,并提供HQL(Hive SQL)查询功能,不用编写具体的MapReduce方法。所有Hive 的数据都存储在Hadoop 兼容的文件系统(如HDFS)中。Hive 在加载数据过程中不会对数据进行任...原创 2019-09-05 15:50:05 · 552 阅读 · 0 评论 -
Hive级联求和
基本需求:根据访客的每日访问信息,进行累计访问,计算每个月访问量,总访问量。输入数据:有如下访客访问次数统计表 t_access_times。为了减轻计算复杂度,去掉了天的信息只留下了年月。+--------------------------+-----------------------+-----------------------------+--+| t_access_time...原创 2019-09-08 20:37:49 · 195 阅读 · 0 评论 -
时间维度表脚本
时间维度表创建的脚本根据不同的也无需求选择需要的字段即可!在MySQL里面创建存储过程--创建dim数据库,使用utf8编码create database dim DEFAULT CHARACTER SET utf8;--切换到dim数据库use dim;--创建dim_day表create table dim_day(DAY_ID varchar(100),DAY_SH...原创 2019-09-08 21:31:49 · 1104 阅读 · 0 评论