由于hive对hive表的管理实质上就是管理hdfs目录,因此相对来说垃圾回收相对来说比较简单
1.hive 外部表的删除
由于外部表不由hive管理,因此,在hive里面删除外部表,删除的仅仅是hive的元数据,原始数据还存在hdfs上,所以对于外部表而言,只需要重建一下表,然后重新装载一下数据即可。
2.hive 内部表的删除
由于hive内部表的管理者是hive,因此,hive的内部表删除了,就真的删除了。
3.hive的垃圾回收机制(实际上是hdfs的垃圾回收机制)
实际上默认hdfs的垃圾回收机制是没有开启的,我们可以通过配置开启垃圾回收
修改hadoop的配置文件core-site.xml
:(添加配置)
<property>
<name>fs.trash.interval</namename&