CDH中 HDFS开启回收站

博客介绍了Hadoop的垃圾桶功能和检查点设置。fs.trash.interval控制垃圾桶功能,为零则禁用,设置7天可让回收站文件7天后永久删除,可使用特定命令直接删除文件。fs.trash.checkpoint.interval设置创建检查点时间间隔,还提及手动清空检查点及相关参数关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. fs.trash.interval    垃圾桶功能(需要重启HDFS)

        如果为零,垃圾桶功能将被禁用

        设置7天后垃圾回收站中的文件会被系统永久删除

        如果需要直接删除,不放进回收站需要使用下面命令删除

        hadoop fs -rm -r -skipTrash /test

      2. fs.trash.checkpoint.interval    创建检查点时间间隔(需要重启HDFS)

       设置1小时创建一次检查点目录,会在  /user/用户  下每隔1小时创建一个检查点目录,并把垃圾回收站中的文件移动到该目录下

        201101151200为检查点目录

        手动清空检查点    hadoop fs -expunge

        等到7天后将删除所有检查点目录,如果该参数为0,则该值默认设置为fs.trash.interval的值,会在每次创建检查点时删除比fs.trash.interva更早创建的检查点目录

        设置的值应为    <=fs.trash.interval

        

 

### CDH HDFS 配置文件位置及其说明 对于Cloudera Distribution Including Apache Hadoop (CDH),HDFS配置文件的位置和作用如下: #### 1. 主要配置文件路径 主要的HDFS配置文件通常位于`/etc/hadoop/conf`目录下,此目录由Cloudera Manager管理并分发给集群中的节点。这些配置文件包括但不限于: - `core-site.xml`: 定义了Hadoop核心属性设置,如指定FileSystem类实现[^1]。 - `hdfs-site.xml`: 包含特定于HDFS服务端参数设定,比如副本因子、块大小等重要选项。 #### 2. Cloudera Manager自动生成配置 当通过Cloudera Manager部署或更新组件时,会自动创建额外的过程级配置文件夹,用于存储各个角色实例的具体配置。例如,在执行某些操作期间可能会看到类似这样的路径 `/run/cloudera-scm-agent/process/<process_id>/...` 下存在多个版本的服务配置文件副本[^2]。 #### 3. Parcels包内的默认配置模板 除了上述动态生成的配置外,安装在系统上的Parcel包也携带了一套原始未修改过的配置样例,存放在类似于`/opt/cloudera/parcels/CDH/lib/hadoop/etc/hadoop/` 的地方。这里保存着未经任何改动的基础配置文档作为参考[^4]。 ```bash # 查看具体某个配置文件的内容可以使用cat命令 cat /etc/hadoop/conf/core-site.xml ``` 为了确保最佳实践,建议始终依赖Cloudera Manager来进行集中式的配置管理和变更控制,而不是手动编辑单个服务器上的文件。这有助于保持整个集群的一致性和稳定性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值