hive相关语句及打jar包运行范例等

本文详细介绍了Hive的各种操作,包括查看表在HDFS的目录、设置reduce个数、创建内部表和外部表、分区表的管理、数据迁移、查询语句(如sort by、order by、group by等)、视图与索引的创建与管理,以及Hive的常用函数和UDF函数的使用。同时,提供了打jar包运行Hive自定义函数的步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

hive的语句

  • 查看表在hdfs上的目录
    show create table 表名
  • 设置reduce个数
    set mapred.reduce.tasks=4;
  • 创建内部表并指定分隔符
create table person(name STRING,age INT)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';
  • 映射文件(内部表)
    • 将文件copy到hdfs下对应表下的文件夹
    • 从本地文件映射,并且load会将文件自动保存到hdfs上的/user/hive/warehouse中
    • load data hdfs上的数据时,会将数据剪切到hive表所在文件中,无论内部表还是外部表。
      LOAD DATA LOCAL INPATH '/home/hadoop/hfxdoc/person.txt' OVERWRITE INTO TABLE person;
  • 映射文件(外部表创建及映射)
create external table fz_external_table(id int,name string,age int,tel string)

    > ROW FORMAT DELIMITED

    > FIELDS TERMINATED BY ','

    > STORED AS TEXTFILE

    > location '/user/hive/external/fz_external_table';
  • 必须是目录,不能是文件(在hdfs上)使用location的话,在hive的数据仓库看不到,不使用location的话,会保存到hive的数据仓库上(删除表数据不丢失);

分区表

  • 创建
    • partition 必须放在row format前面
create external table demo1(id int,name string,age int)partitioned by (month string,day string)row format delimited fields terminated by ',';
  • 导入数据增加分区
    分区表导入数据要是用load data
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值