使用hive进行数据分析已经有两年多了,但是始终没有发现任何一份文档来说明各个参数的用法,本文就来做这样一件事。
1. _hive.hdfs.session.path
每次打开一个hive客户端,就产生了一个会话(session),会生成一个_tmp_space.db文件,这个文件的存储路径就是这个参数的值。使用hdfs -ls命令可以看到(如下),不是本地路径。但_tmp_space.db是个什么格式,存储什么内容,有待进一步研究。
hdfs -ls /home/hive/scratchdir/hdp-jiagu/c1714dde-5c52-45f4-bc57-2af40df28273
2. _hive.local.session.path
顾名思义,每个会话产生的本地路径,直接 ls 就可以看到,如下:
ls /home/hadoop_tmp_dir/hdp-jiagu/c1714dde-5c52-45f4-bc57-2af40df28273
也不清楚这里面存的是啥。
3. _hive.tmp_table_space
这是你在控制台上创建的临时表的hdfs路径
4. datanucleus.autoCreateSchema
如果元数据不存在,那么直接创建,如果设置为false,那么在之后创建。通常使用默认设置即可。
5.