windows数据导入到hive表

本文介绍了如何将Windows系统的.zip数据导入到Hive表中。首先在Linux环境中创建数据库和外部表,然后通过Winscp将.zip文件复制并解压到Linux本地,最后使用LOAD DATA命令将数据加载到Hive表。同时提到了在执行Hive SQL脚本时避免直接在Hadoop环境下运行以防止异常,并分享了相关资源和操作技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需求说明:
  • 将windows系统下数据存入hive表中
  • windows下数据源是压缩格式,即.zip
  • 本文中本地环境是指linux环境
实例:
  1. 逻辑:
    • 建表(根据数据源或需求建普通表或分区表)—>加载数据—>将windows中.zip数据复制到本地—>本地解压zip数据—>执行hive命令
  2. 建数据库。 hive创建数据库testdb

    CREATE DATABASE IF NOT EXISTS testdb;
    
  3. 建表。hive创建外部表test

    CREATE EXTERNAL TABLE IF NOT EXISTS test
    (
    id STRING,tit STRING,ts  STRING,url STRING
    )
    PARTITIONED BY (datelabel STRING)
    ROW FORMAT DELIMITED
    FIELDS TERMINATED BY '\t'
    stored as textfile
    location '/test/data';
    
  4. 复制数据源到本地。将windows数据移动到本地文件夹下(linux环境下)

    • 将windows下data.zip复制到linux下。由于安装winscp软件,直接在winscp软件中拖拽即可实现复制,也可使用命令行。
    • 移动到本地/home/myhadoop/下,先解压data.zip到/home/myhadoop/data/testdata目录下。

      • 解压命令:

        unzip /home/myhadoop/data.zip //解压zip到当前目录
        unzip /home/myhadoop/data.zip -d /
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值