Sqoop学习 day02

这篇博客详细记录了使用Sqoop将数据从Mysql导入到Hive和HBase的过程,包括不同导入方式、配置步骤及遇到的中文乱码问题的解决方案。同时,也涵盖了将Hive和HDFS中的数据导回MySql的实操案例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天,我继续学习了Sqoop。首先,先是复习了之前学过的内容,然后,学习了MySql-to-Hive、MySql-to-Hive-总结、MySql-to-HBase、MySql-to-HBase-总结、MySql-to-Hive-原理、HDFS-Hive-to-MySql、Hive和HBase整合集成、重新编译hive-hbase-handler-1.2.1.jar、hive-hbase-案例、HBase-To-MySql、脚本、常用命令、公有参数、命令参数-import、命令参数-export-codegen、命令参数-create-hive-table、命令参数-eval、命令参数-import-all-tables、命令参数-job、命令参数-list-databases、命令参数-list-tables、命令参数-merge、命令参数-metastore。
总结一下:
1.mysql to Hive
启动hdfs
启动yarn
方式1
创建表然后再导入数据
方式2
导入数据,然后再创建表
方式3
导入数据,表自动创建
1)sqoop的conf目录需要hive-site.xml的配置文件
2)hive的元数据需要配置在mysql里面,而非derby数据库
3)sqoop语句
[alex@hadoop102 sqoop-1.4.7.bin__hadoop-2.6.0]$ bin/sqoop import
–connect
jdbc:mysql://hadoop103:3306/company
–username root
–password 000000
–table staff
–num-mappers 1
–fields-terminated-by “\t”
–hive-import
–hive-overwrite
–hive-table staff_hive \

create table staff_hive(id int,name string,sex
string) row format delimited fields terminated by ‘\t’ ;
create table staff_hive1(id int,name string,sex string) row format delimited fields terminated by ‘\t’ ;

[alex@hadoop102 sqoop-1.4.7.bin__hadoop-2.6.0]$ bin/sqoop import
–connect
jdbc:mysql://hadoop103:3306/company
–username root
–password 000000
–table staff
–num-mappers 1
–fields-terminated-by “\t”
–hive-import
–hive-overwrite
–hive-table staff_hive
2.mysql to hbase
1、启动服务
1)启动hdfs,因为hbase数据存在hdfs上面
2)启动yarn,因为sqoop命令翻译成mapreduce运行在yarn上面
3)启动zookeeper,因为hbase使用外置zookeeper
4)启动mysql
5)启动hbase
2、mysql数据准备
3、执行sqoop命令
[victor@node1 conf]$ bin/sqoop import
–connect jdbc:mysql://hadoop103:3306/db_library
–username root
–password 000000
–table book
–columns “id,name,price”
–column-family “info”
–hbase-create-table
–hbase-row-key “id”
–hbase-table “hbase_book”
–num-mappers 1
–split-by id

[alex@hadoop102 sqoop-1.4.7]$ bin/sqoop import
–connect jdbc:mysql://hadoop103:3306/company
–username root
–password 000000
–table staff
–columns “id,name,sex”
–column-family “info”
–hbase-create-table
–hbase-row-key “id”
–hbase-table “hbase_staff”
–num-mappers 1
–split-by id

[alex@hadoop102 sqoop-1.4.7]$ bin/sqoop import
–connect
jdbc:mysql://hadoop103:3306/company
–username root
–password 000000
–table staff
–columns “id,name,sex”
–column-family “info”
–hbase-row-key “id”
–hbase-table “mk1”
–num-mappers 1
–split-by id
3.Hive/HDFS to Mysql
[victor@node1 sqoop-1.4.7]$ bin/sqoop export
–connect jdbc:mysql://hadoop103:3306/company
–username root
–password 000000
–table staff
–num-mappers 1
–export-dir /user/hive/warehouse/staff_hive3
–input-fields-terminated-by “\t”

中文乱码问题解决
[alex@hadoop102 sqoop-1.4.7]$ bin/sqoop export
–connect jdbc:mysql://hadoop103:3306/company?characterEncoding=UTF-8
–username root
–password 000000
–table staff
–num-mappers 1
–export-dir /user/hive/warehouse/staff_hive3
–input-fields-terminated-by “\t”

### PyCharm 打开文件显示全的解决方案 当遇到PyCharm打开文件显示全的情况时,可以尝试以下几种方法来解决问题。 #### 方法一:清理缓存并重启IDE 有时IDE内部缓存可能导致文件加载异常。通过清除缓存再启动程序能够有效改善此状况。具体操作路径为`File -> Invalidate Caches / Restart...`,之后按照提示完成相应动作即可[^1]。 #### 方法二:调整编辑器字体设置 如果是因为字体原因造成的内容显示问题,则可以通过修改编辑区内的文字样式来进行修复。进入`Settings/Preferences | Editor | Font`选项卡内更改合适的字号大小以及启用抗锯齿功能等参数配置[^2]。 #### 方法三:检查项目结构配置 对于某些特定场景下的源码视图缺失现象,可能是由于当前工作空间未能正确识别全部模块所引起。此时应该核查Project Structure的Content Roots设定项是否涵盖了整个工程根目录;必要时可手动添加遗漏部分,并保存变更生效[^3]。 ```python # 示例代码用于展示如何获取当前项目的根路径,在实际应用中可根据需求调用该函数辅助排查问题 import os def get_project_root(): current_file = os.path.abspath(__file__) project_dir = os.path.dirname(current_file) while not os.path.exists(os.path.join(project_dir, '.idea')): parent_dir = os.path.dirname(project_dir) if parent_dir == project_dir: break project_dir = parent_dir return project_dir print(f"Current Project Root Directory is {get_project_root()}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值