df查看磁盘空间占用满了,却找不到大文件

某服务器邮件报警磁盘空间占用大,用df -hT查看,在根目录用du查找大目录,各目录容量总和不到20G。发现/usr/local/datax/下文件状态为deleted但句柄仍打开,因进程使用文件,删除后未释放空间,kill该进程后问题解决。

某台搭建的服务器,邮件一直报警磁盘空间占用大。于是df -hT查看。

Filesystem                                                 Type      Size  Used Avail Use% Mounted on
devtmpfs                                                   devtmpfs  7.8G     0  7.8G   0% /dev
tmpfs                                                      tmpfs     7.8G     0  7.8G   0% /dev/shm
tmpfs                                                      tmpfs     7.8G   42M  7.8G   1% /run
tmpfs                                                      tmpfs     7.8G     0  7.8G   0% /sys/fs/cgroup
/dev/mapper/centos-root                                    xfs        44G    41G  20M  98% /

在根目录下通过du查找占用较大的目录,但得出的结论是所有目录容量加一块也才不到20G。那问题出在哪里。

后面百度得知,原来有的文件可能删除了,但是并没有被释放,就像进入回收站一样,于是用lsof命令查看那些删除了但是还打开着文件句柄的文件,并按照大小顺序排列。

# lsof -n | grep delete
http-nio- 23548 23644           root  258r      REG              253,0       62661    1093974 /usr/local/datax/datax-web-2.1.2/modules/datax-admin/lib/hbase-replication-2.0.0.jar (deleted)
http-nio- 23548 23644           root  259r      REG              253,0      175251    1093975 /usr/local/datax/datax-web-2.1.2/modules/datax-admin/lib/stream-2.9.5.jar (deleted)
http-nio- 23548 23644           root  260r      REG              253,0       38059    1093976 /usr/local/datax/datax-web-2.1.2/modules/datax-admin/lib/i18n-util-1.0.4.jar (deleted)
http-nio- 23548 23644           root  261r      REG              253,0    12272759    1093977 /usr/local/datax/datax-web-2.1.2/modules/datax-admin/lib/icu4j-60.2.jar (deleted)
http-nio- 23548 23644           root  262r      REG              253,0       55550    1093978 /usr/local/datax/datax-web-2.1.2/modules/datax-admin/lib/icu4j-localespi-60.2.jar (deleted)
http-nio- 23548 23644           root  263r      REG              253,0     3129624    1093979 /usr/local/datax/datax-web-2.1.2/modules/datax-admin/lib/icu4j-charset-60.2.jar (deleted)
http-nio- 23548 23644           root  264r      REG              253,0       84123    1093980 /usr/local/datax/datax-web-2.1.2/modules/datax-admin/lib/disruptor-3.3.6.jar (deleted)

发现有/usr/local/datax/下所有文件状态为deleted,但是文件句柄仍然被打开了。如果有进程在使用某个文件,你把这个文件删掉之后,它不会马上释放空间,除非你手工重启该进程。于是kill 该进程,问题解决。

]# ps -ef | grep data
root       521     2  0 Apr17 ?        00:00:00 [xfs-data/dm-0]
root       751     2  0 Apr17 ?        00:00:00 [xfs-data/sda1]
root      1917  1326  0 Apr17 tty1     00:00:26 /usr/bin/X :0 -background none -noreset -audit 4 -verbose -auth /run/gdm/auth-for-gdm-QLPF6h/database -seat seat0 -nolisten tcp vt1
root     17926     2  0 May31 ?        00:00:00 [xfs-data/sdb1]
root     23006 16601  0 16:04 pts/0    00:00:00 grep --color=auto data
root     23548     1  0 Apr21 ?        02:19:32 java -Xms2g -Xmx2g -XX:+HeapDumpOnOutOfMemoryError -Dfile.encoding=UTF-8 -XX:HeapDumpPath=/usr/local/datax/datax-web-2.1.2/modules/datax-admin/bin/../logs -Dlog.path=/usr/local/datax/datax-web-2.1.2/modules/datax-admin/bin/../logs -Duser.dir=/usr/local/datax/datax-web-2.1.2/modules/datax-admin/bin/../ -Dserver.port=9527 -Ddata.path=/usr/local/datax/datax-web-2.1.2/modules/datax-admin/bin/../data -Dmail.username=datax -Dmail.password=123456 -Dlogging.config=/usr/local/datax/datax-web-2.1.2/modules/datax-admin/bin/../conf/logback.xml -classpath /usr/local/datax/datax-web-2.1.2/modules/datax-admin/bin/../lib/*:/usr/local/datax/datax-web-2.1.2/modules/datax-admin/bin/../conf:. com.wugui.datax.admin.DataXAdminApplication

# kill -9  23548

# df -hT
Filesystem                                                 Type      Size  Used Avail Use% Mounted on
devtmpfs                                                   devtmpfs  7.8G     0  7.8G   0% /dev
tmpfs                                                      tmpfs     7.8G     0  7.8G   0% /dev/shm
tmpfs                                                      tmpfs     7.8G   42M  7.8G   1% /run
tmpfs                                                      tmpfs     7.8G     0  7.8G   0% /sys/fs/cgroup
/dev/mapper/centos-root                                    xfs        44G   14G   31G  32% /
/dev/sda1                                                  xfs      1014M  292M  723M  29% /boot
tmpfs                                                      tmpfs     1.6G   12K  1.6G   1% /run/user/42
cm_processes                                               tmpfs     7.8G   23M  7.8G   1% /run/cloudera-scm-agent/process
tmpfs                                                      tmpfs     1.6G  4.0K  1.6G   1% /run/user/0

参考链接:
1、磁盘满了,却找不到大文件
https://blog.youkuaiyun.com/maquealone/article/details/83054103
https://blog.youkuaiyun.com/weixin_38642130/article/details/93639563

### Linux 磁盘空间但未发现大文件的原因及解决方法 在 Linux 系统中,磁盘空间被占但未发现大文件的情况可能由以下原因引起,并提供相应的解决方案: #### 1. 已删除但仍在使用的文件 当某些进程正在使用已被删除的文件时,尽管文件从文件系统中不可见,但其数据仍然占用磁盘空间。这种情况下,`du` 命令无法检测到这些文件,而 `df` 命令会显示磁盘已。 - **解决方案**: 使用 `lsof` 命令查被进程占用的已删除文件,并终止相关进程以释放空间。 ```bash sudo lsof | grep deleted ``` 到对应的进程 ID (PID) 后,可以使用以下命令终止该进程: ```bash sudo kill -9 <PID> ``` 如果需要释放空间但不想终止进程,可以通过重定向将文件内容清空: ```bash > /proc/<PID>/fd/<FD> ``` 这里 `<PID>` 是进程 ID,`<FD>` 是文件描述符[^4]。 #### 2. 文件系统元数据问题 有时,文件系统的元数据可能会损坏,导致 `df` 和 `du` 的输出不一致。例如,`df` 显示磁盘已,但 `du` 未能到足够的文件来解释这种占用。 - **解决方案**: 检查并修复文件系统错误。首先卸载文件系统(如果可能),然后运行 `fsck` 工具进行修复: ```bash sudo umount <filesystem> sudo fsck <filesystem> ``` 如果无法卸载文件系统(例如根分区),可以在单用户模式下执行上述操作[^1]。 #### 3. inode 耗尽 即使磁盘空间仍有剩余,但如果 inode 被耗尽,也会导致“no space left on device”的错误。这种情况通常发生在包含大量小文件的目录中。 - **解决方案**: 检查 inode 使用情况: ```bash df -i ``` 如果 inode 已用接近 100%,则需要定位并清理不必要的小文件。可以使用以下命令查包含大量小文件的目录: ```bash find / -xdev -type f | cut -d "/" -f 2 | sort | uniq -c | sort -nr ``` 删除不必要的文件或重新规划存储结构以避免 inode 耗尽[^3]。 #### 4. 隐藏的大文件或临时文件 某些隐藏文件或临时文件可能未被常规搜索命令发现。例如,位于 `/tmp` 或 `/var/tmp` 中的文件可能会占用大量空间。 - **解决方案**: 使用以下命令查隐藏文件和临时文件: ```bash find / \( -name "*.log" -o -name "core" -o -name ".tmp*" \) -exec ls -lh {} \; ``` 根据需要清理这些文件[^2]。 #### 5. 日志文件增长过快 日志文件(如 `/var/log/` 下的文件)可能因未设置轮转策略而快速增长,导致磁盘空间被迅速耗尽。 - **解决方案**: 检查日志文件大小: ```bash du -sh /var/log/* ``` 如果发现过大日志文件,可以手动清空或配置日志轮转工具(如 `logrotate`)以限制日志文件大小: ```bash > /var/log/<logfile> ``` 编辑 `/etc/logrotate.conf` 或 `/etc/logrotate.d/` 下的相关配置文件,确保日志文件不会无限增长[^3]。 --- ### 示例代码 以下是一个脚本示例,用于自动查并处理占用磁盘空间的隐藏问题: ```bash #!/bin/bash # 查被进程占用的已删除文件 echo "Checking for deleted but open files..." sudo lsof | grep deleted # 查 inode 耗尽的问题 echo "Checking inode usage..." df -i # 查隐藏的大文件 echo "Searching for hidden large files..." find / \( -name "*.log" -o -name "core" -o -name ".tmp*" \) -size +100M -exec ls -lh {} \; # 清理临时文件 echo "Cleaning up temporary files..." sudo rm -rf /tmp/* ``` --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值