在大数据平台中,hdfs里面如果误删除文件后,我们需要对文件进行恢复,但是如果没有做相关配置,或者预先做设置,则会导致灾难性的后果,o(╥﹏╥)o
我们可以通过下面几种方式来恢复误删除文件:
在垃圾回收站中恢复:hdfs中提供类似其他文件系统中的垃圾回收站的功能,被删除的文件会被移动到该回收站中,也就是有的同学想要腾出空间,使用了hadoop fs -rmr 文件后,hdfs的空间还是没有腾出来,这就是被移动到了回收站,文件没有被清除,需要我们手动的使用删除命令去删除回收站的文件,才能达到效果。要启用垃圾回收箱的功能,我们需要注意的是需要我们手动在hdfs-site.xml中配置如下信息:
<property>
<name>fs.trash.interval</name>
<value>1440</value>
<description>
该值为设置放入回收站后保存的时长,分钟数
</description>
</property>

在HDFS中误删除文件可以通过垃圾回收站、快照或编辑日志恢复。启用回收站需配置hdfs-site.xml,删除的文件会被移到Trash,可从那里恢复。快照功能允许对整个文件系统或特定目录创建镜像,用于删除后的恢复,不受回收站时间限制。如果以上方法不可行,可尝试在NameNode的编辑日志中截断删除命令,但此方法风险较高且可能不成功。
最低0.47元/天 解锁文章
1602

被折叠的 条评论
为什么被折叠?



