hive将元数据存储在metastore上,将数据存储在hdfs上;二者怎么关联呢?
其实就是:我们在hive客户端建立一个table,当该table的路径与hdfs上的存储数据的路径一致时,二者便可以联系起来。
准备基础
1.Hadoop安装,hdfs集群启动
2. hive安装
3. 用jps命令查看各客户端的启动情况;如下:
数据准备
我们想要上传到hdfs上的数据内容如下:
先创建一个 testdata.txt
touch testdata.txt
{
"name": "songsong",
"friends": ["bin