继续完善之前的项目——Sqoop数据导出+Superset数据可视化
进度
之前已经安装完sqoop、创建完表,搭建好数据仓库。
在分析完核心指标之后,我们需要将指标数据导出到mysql数据库中,便于后续的应用,比如结果指标的可视化。
Apache Sqoop是在Hadoop生态体系和RDBMS体系之间传送数据的一种工具。来自于Apache软件基金会提供。
Hadoop生态系统包括:HDFS、Hive、Hbase等
RDBMS体系包括:Mysql、Oracle、DB2等
Sqoop可以理解为:“SQL 到 Hadoop 和 Hadoop 到SQL”。
Step2:在mysql里对应创建app_didi表
step3: 将hive结果导入到MySQL
step4: 使用superset进行数据可视化
详细参看文档。这里不展开介绍。