
Hive
heartless_killer
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hadoop系列十一 ——MapReduce案例分组求top n(对象覆盖问题)
需求: 有如下数据(本案例用了排序控制、分区控制、分组控制) order001,u001,小米6,1999.9,2 order001,u001,雀巢咖啡,99.0,2 order001,u001,安慕希,250.0,2 order001,u001,经典红双喜,200.0,4 order001,u001,防水电脑包,400.0,2 order002,u002,小米手环,199.0,3 order00...原创 2019-10-19 17:05:37 · 380 阅读 · 0 评论 -
hadoop系列五 ——hive操作
创建库 hive中有一个默认的库: 库名: default 库目录:hdfs://hdp20-01:9000/user/hive/warehouse 新建库: create database databaseName; 库建好后,在hdfs中会生成一个库目录: hdfs://hdp20-01:9000/user/hive/warehouse/db_order.db 展示所有库的名字: show d...原创 2019-10-13 21:34:56 · 851 阅读 · 1 评论 -
hadoop系列四 ——hive基本概念
什么是Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 Hive 具有 SQL 数据库的外表,但应用场景完全不同,Hive 只适合用来做海量离线数 据统计分析,也就是数据仓库。 本质是:将HQL/SQL转化成MapReduce程序 1)Hive处理的数据存储在HDFS 2)Hive分析数据底层的实现是MapReduce 3)...原创 2019-10-13 15:55:42 · 483 阅读 · 1 评论