导入表数据子集
我们可以导入表的使用Sqoop导入工具,"where"子句的一个子集。它执行在各自的数据库服务器相应的SQL查询,并将结果存储在HDFS的目标目录。
where子句的语法如下。
--where <condition> |
下面的命令用来导入emp_add表数据的子集。子集查询检索员工ID和地址,居住城市为:Secunderabad
bin/sqoop import \ --connect jdbc:mysql://itcast01:3306/userdb \ --username root \ --password root123 \ --where "city ='sec-bad'" \ --target-dir /wherequery \ --table emp_add --m 1 |
按需求导入
bin/sqoop import \ --connect jdbc:mysql://itcast01:3306/userdb \ --username root \ --password root123 \ --target-dir /wherequery2 \ --query 'select id,name,deg from emp WHERE id>1207 and $CONDITIONS' \ --split-by id \ --fields-terminated-by '\t' \ --m 1 |
本文介绍如何使用Sqoop工具通过WHERE子句导入MySQL数据库中特定子集的数据到HDFS。文中提供了具体的命令实例,包括按条件筛选数据及自定义查询。
906

被折叠的 条评论
为什么被折叠?



