大数据分析:从Hive到NoSQL的探索
1. 使用Hive分析石油进口价格
在进行石油进口价格分析时,我们可以借助Hive工具,对1980 - 2016年全球各国的石油进口价格数据进行深入挖掘。以下是具体的操作步骤:
1. 下载CSV文件 :
bash cd /home/cloudera; wget -O oil.csv "https://stats.oecd.org/sdmx-json/data/DP_LIVE/.OILIMPPRICE.../OECD?contentType=csv&detail=code&separator=comma&csv-lang=en"
2. 清理CSV文件 :
- 去除双引号:
bash sed -i 's/\"//g' oil.csv
- 去除不可打印字符:
bash tr -cd '\11\12\15\40-\176' oil_.csv > oil_clean.csv
- 复制新文件覆盖原文件:
bash mv oil_clean.csv oil.csv
3. 登录Cloudera Hue :
- 在浏览器书签栏点击Hue,进入Cloudera登录界面,使用ID cloudera 和密码 cloudera 登录。
- 在Hue登录窗口顶部的快速启动下拉菜
超级会员免费看
订阅专栏 解锁全文

2705

被折叠的 条评论
为什么被折叠?



