
hive
大数据狂人
学无止境
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hive的数据类型简介
Hive的内置数据类型分为两大类:1、基础数据类型;2、复杂数据类型。一、基础数据类型包括:二、复杂数据类型包括:ARRAY、Map、struct、union,这些复杂类型是由基础类型构成的。ARRAY:ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由 ['apple','orange','mango']组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从 0..原创 2020-08-12 21:33:15 · 2630 阅读 · 2 评论 -
ORC与Parquet文件对比
ORC与Parquet总结如下:转载:https://blog.youkuaiyun.com/qq_22222499/article/details/106534767?utm_medium=distribute.pc_relevant.none-task-blog-baidulandingword-6&spm=1001.2101.3001.4242转载 2020-08-10 14:58:38 · 2268 阅读 · 0 评论 -
RuntimeException: root scratch dir: /tmp/hive在HDFS上应该是可写的。当前权限为:rwx——
Logging initialized using configuration in jar:file:/export/servers/hive-1.1.0-cdh5.14.0/lib/hive-common-1.1.0-cdh5.14.0.jar!/hive-log4j.properties Exception in thread "main" java.lang.RuntimeExcep...原创 2020-04-26 15:36:53 · 1932 阅读 · 0 评论 -
hive的知识点总结
1、什么是Hive?Hive是基于Hadoop的一个数据仓库工具,能将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能,(能将SQL语句转变成MapReduce任务来执行。)2、Hive的意义(最初研发的原因)?降低程序员使用Hadoop的难度,降低学习成本,3、Hive的内部组成模块,作用分别是什么?元数据:描述数据的数据内部执行流...原创 2019-11-29 17:08:43 · 1945 阅读 · 0 评论 -
内部表和外部表区别和详解
在linux中进行文件上传1.上传student.csv和techer.csv文件到linux上的/opt/hive上2.使用myhive数据库3.创建表并将本地文件上传到表中创建老师表(外部表):create external table techer (t_id string,t_name string) row format delimited...原创 2019-11-20 10:12:41 · 6706 阅读 · 4 评论