数据源 .csv .txt … mysql oracle
sqoop (数据迁移) mysql =》hdfs 全量,增量
flume(数据迁移)文件 =》 console(控制台),kafka, hdfs
数据仓库(hdfs)
user_friends_raw
user_friends=>flume > kafka(user_friends_raw) >kafkaSteaming>kafka(user_friends)> hbase > hive 外表> 特征集提取
数据源 .csv .txt … mysql oracle
sqoop (数据迁移) mysql =》hdfs 全量,增量
flume(数据迁移)文件 =》 console(控制台),kafka, hdfs
数据仓库(hdfs)
user_friends_raw
user_friends=>flume > kafka(user_friends_raw) >kafkaSteaming>kafka(user_friends)> hbase > hive 外表> 特征集提取