
Hive
木生火18624
多练内功
展开
-
22HIVE的分区分桶——好程序
为什么要分区? 随着系统运行时间增长,表的数据量越来越大,而hive查询通常是全表扫描,这样会导致大量不必要的数据扫描,从而大大降低了查询效率。 从而引进了分区技术,使用分区技术,避免hive全表扫描,提升查询效率。 分区的技术 PARTITIONED BY (column_name data_type) 1、hive分区是区分大小写的 2、hive的分区本质是在表目录下创建分区目录,但是该分区...原创 2020-02-24 19:47:03 · 494 阅读 · 0 评论 -
21HIVE的基本操作——好程序
表的修改操作 不建议用 in ,not in ,exists,not exists,而是用join in not in exists not exists join 查看表 show create table 表名 修改表: hive alter table t_name rename to (comment:说明) alter table t3 rename to t_userinfo...原创 2020-02-24 14:26:11 · 605 阅读 · 0 评论 -
20HIVE的基本操作——好程序
注释 // /** */ <!----> # -- 语法规则: hive的数据库名、表名不区分大小写。mysql是可以设置区分大小写的命名规则: 1、名字不能使用数字开头 2、不能使用关键字 3、尽量不要使用特殊符号 hive中有一个默认的数据库default,如果不指定要使用哪个数据库,则使用默认的数据库。 可以查看数据库 show databases; 再切...原创 2020-02-23 11:36:06 · 314 阅读 · 0 评论 -
19hive的基本知识——好程序
为什么有hive facebook最初研发来处理海量的社交数据和机器学习。 hive:简化分析:使用sql,开发效率高500行 mr:10000 hive是什么 hive是一个大数据仓库 hive是一个基于hadoop的数据仓库 hive是一个基于hadoop的数据仓库,可以通过类sql语句来对数据进行读、写、管理(元数据管理) hive的架构(三层) 用户连接客户端:cli、jdbc/o...原创 2020-02-23 08:56:07 · 350 阅读 · 1 评论