大数据处理:Hive分析与NoSQL数据库应用
1. 使用Hive分析石油进口价格
1.1 数据准备
我们将使用Hive分析1980 - 2016年全球各国的石油进口价格。数据可从经合组织(OECD)网站获取,实际的CSV文件链接为: https://stats.oecd.org/sdmx-json/data/DP_LIVE/.OILIMPPRICE…/OECD?contentType=csv&detail=code&separator=comma&csv-lang=en 。
在Cloudera Quickstart CDH环境中,通过终端将文件下载到主目录,具体步骤如下:
1. 下载CSV文件 :
cd /home/cloudera;
wget -O oil.csv "https://stats.oecd.org/sdmx-json/data/DP_LIVE/.OILIMPPRICE.../OECD?contentType=csv&detail=code&separator=comma&csv-lang=en"