hive建表语句

最新推荐文章于 2022-11-25 21:49:58 发布

原创最新推荐文章于 2022-11-25 21:49:58 发布 · 228 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#hive #内部表 #外部表

Hive 专栏收录该内容

8 篇文章

订阅专栏

hive建表：

内部表：

#创建内部表
create table LL_test (

id int,

name string,

age int

)

row format delimited fields terminated by '\001'

stored as textfile;

外部表：

#创建外部表

create  external table LL_test (

id int,

name string,

age int

)

stored as textfile

location '/hdfs/tmp/data/LL_test';

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

桔梗的犬夜叉

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

精选资源

mysql数据抽取，自动生成hive建表语句

03-11

本教程主要围绕“mysql数据抽取，自动生成hive建表语句”这一主题展开，讲解如何高效地实现这一过程。首先，我们需要理解MySQL与Hive之间的数据模型差异。MySQL通常使用行式存储，支持复杂的事务处理，适合频繁的...

Hive-数据类型和建表语法

m0_46538284的博客

11-28

1068

数据类型 TINYINT 1byte有符号整数 20 SMALLINT 2byte有符号整数 20 INT ** 有符号整数 20 BIGINT** 8byte有符号整数 20 BOOLEAN 布尔类型，true或者false TRUE FALSE FLOAT 单精度浮点数 3.14159 DOUBLE ** 双...

参与评论您还未登录，请先登录后发表或查看评论

Hive基础学习

hitchenghengchao的博客

06-09

452

本节我们主要来学习一些hive的命令操作，同时探究一下Hive，HDFS，MySQL之间的联系，从而更好的理解其内部原理。常用的基础命令#此处的命令都是指在hive命令行...

【Hive】Hive 创建表

thatdanielyang的博客

10-16

1万+

学习笔记—Hive创建表 1. Hive语句的特点 HQL 语言大小写不敏感，但内容分大小写（where ,if/ case when，如：数据表内容某人名叫Tom，则条件后不能写tom，HDFS 路径名（NameNode）分大小写）； HQL 可以写在一行或者多行，关键字不能被缩写也不能分行，同 SQL；各子句一般要分行写，使用缩进提高语句的可读性，为了美化，同SQL； -- 为注释符号； Hive 不存储数据，他是表到HDFS文件的映射关系（语句）； 2. DDL 2.1 Hive的数据库DD

Hive学习3：Hive三种建表语句详解

热门推荐

Liu_Arvin的芝士小栈

10-29

13万+

Hive学习3：Hive三种建表语句详解

hive中的三种建表方法

wgyzzzz的博客

07-19

6619

文章目录一、直接建表二、查询建表三、like建表一、直接建表 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] employee_external ( //EXTERNAL关键字添加为外部表 name string, work_place ARRAY<string>, sex_age STRUCT<sex:string,age:int>, skills_score MAP<string,int>,

精选资源

Mysql元数据如何生成Hive建表语句注释脚本详解

01-19

本文主要给大家介绍了关于Mysql元数据生成Hive建表语句注释脚本的相关内容，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介绍：最近在将数据从Mysql 等其他关系型数据库抽取到Hive 表中时，需要同步...

java根据excel生成 hive建表语句

04-20

Java作为企业级应用开发的主要语言，经常被用来处理与数据相关的任务，包括从Excel文件读取数据并生成Hive建表语句。下面我们将详细探讨如何使用Java和Apache POI库来实现这一功能。首先，Apache POI是Java中处理...

hive load data外部表报错_【HIVE】不会Java也能操作Hadoop，常用HQL语句，收藏就是赚了。...

weixin_39888180的博客

11-26

295

show databases；查看都有哪些数据库。create database park；创建park数据库创建的数据库，实际是在Hadoop的HDFS文件系统里创建一个目录节点，统一存在： /user/hive/warehouse 目录下use park;进入park数据库show tables;查看当前数据库下所有表create table stu (id int,name string);...

Hive中的建表方式

weixin_59306821的博客

11-25

2038

hive中的建表语法，查看表结构方式

Hive常用的建表语句

王凯凯之猿的博客

05-21

6399

1，创建表,external 外部表 $hive>CREATE external TABLE IF NOT EXISTS customer(id int,name string,age int) ROW FORMAT DELIMITED FIELDS TERMINATED BY '...

hive3.1.2 笔记知识点详解(二)内部表外部表 导入数据方式

小丑八怪的博客

11-29

785

1 内部表和外部表 在hive中的表分两种 1)外部表 external 2)内部表 默认的也称管理表 managertable 区别详解：先创建一个表 create table tb_log( id int, name string， age int, gender string ) row format delimited fields terminated by ‘,’ location ‘hdfs://linux01:8020/data/log/’ 创建一个表(管理表) c

Hive文件格式（RCFILE）

寂寞相思鸟

04-28

3816

hive文件存储格式包括以下几类： 1、TEXTFILE 2、SEQUENCEFILE 3、RCFILE 4、ORCFILE(0.11以后出现) 其中TEXTFILE为默认格式，建表时不指定默认为这个格式，导入数据时会直接把数据文件拷贝到hdfs上不进行处理； SEQUENCEFILE，RCFILE，ORCFILE格式的表不能直接从本地文件导入数据，数据要先导入

Hive三种建表语句详解

qq_36041534的博客

05-15

8594

转载注：hive其他语法在hive官网有说明，建议初学者，去官网学习一手的资料，官网：https://cwiki.apache.org/confluence/display/Hive/Home#Home-UserDocumentationCreate Table官网说明Hive建表方式共有三种：直接建表法查询建表法like建表法首先看官网介绍 ‘[]’ 表示可选，’|’ 表示二选一CREATE ...

Hive常见操作语句--创建表语句

杨春建的博客

03-08

1058

原文地址：http://bestchenwu.iteye.com/blog/2171795 一：hive建表语句 Sql代码 create table page_view ( page_id bigint comment '页面ID', page_name string comment '页面名称', page_url stri

mysql 建表语句 stored as_hive的指令操作及内外临时表的创建

weixin_35335035的博客

02-18

1577

2、数据库： OLTP//online transaction process ,在线事务处理3、drop databases if exists mybase//删除数据库4、show tables//显示表5、create database mybase//mysql 创建库6、create table test(id int ,name varchar(20));//创建列表7、se...

hive创建四种表

鲍礼彬的优快云博客 ~_~

03-04

6808

hive创建四种表 内部表、分区表、桶表、外部表 1、 内部表：待上传的内容：创建一个tb1表，两个字段之间用Tab键隔开：执行命令：CREATE TABLE tb1(name string,id int) ROW FORMATDELIMITED FIELDS TERMINATED BY '\t'; hive> CREATE TABLE tb1(name s

Hive 建表语句详解

weixin_53299145的博客

12-03

1万+

一、HQL建表语法格式（hql不区分大小写，[ ]中的属性是可选属性） CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [ (col_name data_type [COMMENT col_comment], ...) ] [COMMENT table_comment] [PARTITIONED BY(col_name data_type [COMMENT col_comment],...) ] [CLUSTERED BY (col_name,col_

Hive 建表语句

最新发布

09-16

<think> 嗯，用户这次询问的是Hive建表语句的相关信息，结合之前的对话历史，用户之前问过character varying字段在Hive中的替代方案，现在显然是想深入理解Hive的表创建机制。用户可能正在搭建数据仓库，需要从PostgreSQL迁移到Hive，所以既关心字段类型的映射（上次的问题），又需要全面了解建表语法（本次的问题）。从用户两次提问的关联性看，应该是个务实的技术人员，关注点很实际——就是要马上能用的代码示例和避坑指南。翻看之前的回复，已经详细解释过字符串类型的对应关系，这次要侧重建表语句本身。引用[1][2][3][4]都提到关键点：内部表/外部表的区别、分区设定、存储格式指定、location用法。特别要注意引用[3]中提到的分区语法和引用[4]强调的外部表路径设置，这些都是实际开发中的高频需求。用户没有明确说使用场景，但根据经验推测可能有这些潜在需求： 1 需要创建分区表处理时间序列数据 2 可能要对接外部存储系统所以需要external table 3 或许会从现有表结构复制（CREATE TABLE AS/LIKE）回复时要突出三个层次：基础语法结构（必选参数）、进阶功能（分区/分桶）、实战技巧（避免数据重复加载）。分区语法示例尤其重要，因为这是用户最可能遇到的性能优化点。最后生成的三个相关问题也很有针对性：数据类型映射延续上次话题，分区策略关乎性能，存储格式影响查询效率——完全覆盖数据仓库建设的核心痛点。这样用户接下来无论遇到哪个环节的问题，都能找到延伸阅读方向。 </think> 以下是Hive建表语句的核心语法及参数详解（附示例），结合官方文档与实际开发高频场景整理： ### 一、基础建表语法 ```sql CREATE [EXTERNAL] TABLE [IF NOT EXISTS] 表名( 列名1 数据类型 [COMMENT '列注释'], 列名2 数据类型, ... ) [PARTITIONED BY (分区列名数据类型, ...)] -- 分区字段不能与主字段重复 [CLUSTERED BY (分桶列名) INTO 分桶数 BUCKETS] -- 分桶存储 [ROW FORMAT row_format] -- 数据格式定义 [STORED AS file_format] -- 存储格式 [LOCATION 'hdfs_path'] -- 数据存储路径（外部表必选） [TBLPROPERTIES (属性名=值,...)]; -- 表级元数据 ``` --- ### 二、关键参数详解（附示例） #### 1. **`EXTERNAL` 关键字** - **内部表**（默认）：数据由Hive管理，删除表时**同时删除HDFS数据** ```sql CREATE TABLE internal_table (id INT, name STRING); ``` - **外部表**：删除表时**只删元数据，保留HDFS数据** ```sql CREATE EXTERNAL TABLE external_table ( dept_no INT, addr STRING ) LOCATION '/user/ext/dept'; -- 必须指定路径[^3][^4] ``` #### 2. **`PARTITIONED BY` 分区** 加速查询，按目录存储数据（分区字段虚拟存在，不占用实际存储）： ```sql CREATE TABLE logs ( ip STRING, url STRING ) PARTITIONED BY (dt STRING); -- 按日期分区[^3] ``` > 📌 **加载分区数据示例**： > ```sql > ALTER TABLE logs ADD PARTITION (dt='2023-10-01'); > ``` #### 3. **`ROW FORMAT` 数据格式定义** 指定字段分隔符（常用文本格式）： ```sql CREATE TABLE csv_data ( id INT, name STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' -- 列分隔符（逗号） LINES TERMINATED BY '\n'; -- 行分隔符（换行符）[^4] ``` #### 4. **`STORED AS` 存储格式** | 格式 | 特点 | 适用场景 | |------------|--------------------------|-----------------------| | `TEXTFILE` | 默认格式，可读性强 | 原始日志（兼容性好） | | `ORC` | 列式存储，高压缩比 | 大数据量分析 | | `PARQUET` | 列式存储，Schema演进支持 | 跨系统数据交换 | ```sql CREATE TABLE orc_table ( id INT, name STRING ) STORED AS ORC; -- 使用ORC格式存储[^2] ``` #### 5. **快速建表方式** - **`LIKE` 复制表结构**： ```sql CREATE TABLE new_table LIKE existing_table; -- 仅复制结构[^1] ``` - **`AS SELECT` 复制结构+数据**： ```sql CREATE TABLE dept_backup AS SELECT * FROM dept; -- 备份数据[^1][^4] ``` --- ### 三、最佳实践建议 1. **路径规范** - 内部表默认路径：`/user/hive/warehouse/库名.db/表名` - 外部表路径需自定义：`LOCATION '/project/user/table_name'` 2. **字符集问题** 中文乱码时需在`TBLPROPERTIES`中指定： ```sql TBLPROPERTIES ('serialization.encoding'='UTF-8') ``` 3. **避免分区陷阱** 分区字段不要与实际字段同名，否则报错： ```sql -- ❌ 错误：addr已存在于主字段 CREATE TABLE dept(dept_no INT, addr STRING) PARTITIONED BY (addr STRING); ``` --- ### 四、完整示例 ```sql CREATE EXTERNAL TABLE user_behavior ( user_id BIGINT, item_id BIGINT, behavior_type STRING ) PARTITIONED BY (dt STRING) -- 按天分区 ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' -- 列分隔符为Tab STORED AS ORC LOCATION '/data/user_behavior' TBLPROPERTIES ('orc.compress'='SNAPPY'); ``` > 参考文档：[Hive官方建表文档](https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-CreateTable)[^2]