目录
一、前言
在大数据项目中需要做数据迁移时,我们第一时间总会想到sqoop。sqoop是apache 旗下一款“Hadoop 和关系数据库服务器之间传送数据”的工具,使用才来也很方便。但因项目需求在使用sqoop是遇到了一些问题,所以决定自己开发一个一个项目解决该问题。
二、使用sqoop遇到的问题
- 想要利用hbase的特性,数据按照Row key的字典序排序存储,但使用sqoop时无法对Row key做特殊处理;
- 使用sqoop将数据导入hbase一些数据都默认变成字符串类型。
三、项目搭建(maven项目)
依赖
| <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.43</version> </dependency> <dependency> <groupId>org.mybatis</groupId> <artifactId>mybatis</artifactId> <version>3.4.1</version> </dependency> <dependency> <groupId>log4j</gr |

本文介绍了在大数据项目中,由于使用sqoop进行数据迁移时遇到的问题,如Row key处理和数据类型转换等,作者决定自行开发一个maven项目来解决这些问题。项目重点包括通过mybatis查询数据并转化为Hbase的二进制类型,灵活处理Row Key和数据过滤。提供了项目代码的GitHub和优快云下载链接,以及数据实时同步的相关文章详情。
最低0.47元/天 解锁文章
2099

被折叠的 条评论
为什么被折叠?



