
hive
你家宝宝
自2018年接触到Java,至今。
展开
-
淘宝双11大数据分析(Hive 分析篇-下)
文章目录前言当前环境创建一个临时表将 user_log 表中的数据插入到 inner_user_log使用 Sqoop 迁移数据MySQL 中的准备导入数据MySQL 中查看数据是否已经导入前言本篇主要是数据迁移,使用 Sqoop 把 Hive 中的数据迁移到 MySQL 中。阅读此篇文章,需要先阅读前篇:淘宝双11大数据分析(环境篇)淘宝双11大数据分析(数据准备篇)淘宝双11大数...原创 2020-02-26 14:59:50 · 3409 阅读 · 9 评论 -
淘宝双11大数据分析(Hive 分析篇-上)
前言阅读此篇文章,需要先阅读前篇:淘宝双11大数据分析(环境篇)淘宝双11大数据分析(数据准备篇)当前环境使用 jps 查看当前启动的服务:(其中 Master 和 Worker是 Spark 的服务,不本篇无关)[root@centos2020 dataset]# jps11408 Master12707 RunJar7876 NameNode8183 ResourceM...原创 2020-02-26 14:09:27 · 5285 阅读 · 0 评论 -
淘宝双11大数据分析(数据准备篇)
文章目录前言数据内容分析`user_log.csv`文件内容含义`train.csv` 和 `test.csv` 文件内容含义数据上传到Linux系统并解压数据集的预处理文件信息截取导入数据到Hive中确认 Hadoop 服务已启动上传数据文件在 Hive 上创建数据表前言阅读前,请先查看前篇:淘宝双11大数据分析(环境篇)数据下载地址:百度云下载另:为求方便行事,我这里的用户全是 roo...原创 2020-02-26 12:45:40 · 10674 阅读 · 6 评论 -
Linux 安装 Hive(以及安装中的问题解决)
文章目录1、下载和解压1、下载和解压官网下载原创 2020-02-25 20:08:59 · 1841 阅读 · 0 评论