1.Sqoop的概念
Sqoop是一个在Hadoop的hdfs和关系型数据库之间传送数据的工具:
传入数据:将关系型数据库(例如:MySQL、Oracle、等)里的数据导入到HDFS中;
传出数据:将HDFS中的数据导出到关系型数据库中。
2.Sqoop的工作流程
3.Sqoop的工作机制
将导入或导出命令翻译成 MapReduce
程序来实现,在翻译出的 MapReduce
中主要是对 InputFormat
和 OutputFormat
进行定制 ,提高了并行度和容错性。