
sqoop
1!="1"
这个作者很懒,什么都没留下…
展开
-
sqoop使用metastore进行增量数据抽取
我们在sqoop抽取数据,肯定会 遇到这么个场景,我们肯定会用到一个调度工具来执行sqoop脚本,这时我们如果想在别的客户端也能调用该sqoop脚本,那么我们就需要使用sqoop提供的metastore,metastore它本质是一个hsql内存级数据库,sqoop通过它达到几个客户端共享sqoop脚本的信息,从而使别的客户端也能调用除自己本身创建的sqoop脚本。 在使用m...原创 2018-11-09 19:47:34 · 2016 阅读 · 0 评论 -
oozie调度sqoop action上传数据到hdfs文件系统
最近在项目中有用到使用sqoop将结构化数据上传到hadoop的hdfs文件系统上,然后通过oozie进行定时调度,期中碰见了一些坑,将其记录下来。在sqoop将数据导入进hdfs上,首先我们需要做的是将源数据库的jdbc驱动添加进oozie的sqoop的lib目录下,因为sqoop导入数据,实质上是通过与数据库建立一个jdbc连接,然后再进行 数据的导入的。一般oozie的lib库在安...原创 2018-12-20 16:48:49 · 1185 阅读 · 0 评论