hive实验

最新推荐文章于 2025-09-05 17:38:00 发布

转载最新推荐文章于 2025-09-05 17:38:00 发布 · 705 阅读

大数据开发专栏收录该内容

113 篇文章

订阅专栏

本文详细介绍了Hive SQL的基本语法和数据操作，包括创建表、加载数据、展示数据库、展示表等核心功能，并通过实例展示了如何创建表、加载数据、使用外部表与内部表以及分区表的操作。

hadoop fs -ls /user/hive/warehouse

show databases;
use mydb;
show tables;
create table test1(id int,name string)partitioned by (dt string);

https://cwiki.apache.org/confluence/display/Hive/Tutorial

create table page_views
(
track_time string,
url string,
session_id string,
referer string,
ip string,
end_user_id string,
city_id string
) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

hive -e "load data local inpath '/home/hadoop/page_views.dat' OVERWRITE INTO TABLE page_views;"

内部表（托管表）
Drop
外边表（external ）
默认分隔符：列为 \001 行为 \n
分区表
Insert overwrite table page…

CREATE TABLE page_view(viewTime INT, userid BIGINT,
page_url STRING, referrer_url STRING,
ip STRING COMMENT 'IP Address of the User')
COMMENT 'This is the page view table'
PARTITIONED BY(dt STRING, country STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '1'
STORED AS SEQUENCEFILE;

select * 不会解析为mapreduce,是直接找hdfs文件