- 博客(3)
- 收藏
- 关注
原创 Sqoop导入导出操作及参数配置
文章目录简介全量导入增量导入默认模式导出更新导出 简介 sqoop就是一个能够在 关系型数据库 和 hadoop 之间实现数据导入导出的工具,关系型数据库数据迁移到hadoop的称为导入,反之为导出。 sqoop底层执行的是 mapreduce中的 mapTask,这是因为它实现数据的迁移,不涉及数据的聚合操作。在导入数据时,mapreduce 程序读取 数据库数据使用 DBinputFo...
2019-11-04 17:01:19
1061
原创 Kudu启动过程中常见错误及解决方法
在kudu启动时,控制台显示启动ok并不一定已经真正启动了kudu-master和kudu-tserver,需要查看进程是否已经运行ps -ef | grep kudu [root@node01 ~]# ps -ef | grep kudu kudu 9644 1 18 00:43 ? 00:00:02 /usr/lib/kudu/sbin/kudu-master ...
2019-10-30 00:47:07
6125
原创 Apache Impala学习笔记
Apache Impala:实时的sql查询工具 1.Impala与Hive关系 impla是个实时的sql查询工具,类似于hive的操作方式,只不过执行的效率极高,号称当下大数据生态圈中执行效率最高的sql类软件 impala来自于cloudera,后来贡献给了apache impala工作底层执行依赖于hive 与hive共用一套元数据存储。在使用impala的时候,必须保证hive服务是...
2019-10-29 00:56:04
517
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅