为了方便用户或应用访问,磁盘在使用之前都会格式化为文件系统,例如:ext4、btrfs、xfs等等。
每种文件系统会按照自己特有的方式来组织文件、管理磁盘空间的分配和回收以及保证原子性、这就需要元数据和日志,必然会导致一些额外的存储空间开销。所以每个磁盘的容量并不能完全被应用使用。在分布式存储容量估算的时候,这一点更加重要。
每个文件系统都实现statvfs接口,来统计存储空间的使用情况。应用可以通过系统调用的方式来获取这一统计信息。下面是简单的代码样例:
#include <stdio.h>
#include <sys/statvfs.h>
#include <stdint.h>
int main(int argc, char* argv[])
{
char *path = argv[1];
struct statvfs sfs;
if (statvfs(path, &sfs) < 0) {
return 0;
}
uint64_t gap = sfs.f_blocks - sfs.f_bavail;
printf("%lu\n", gap);
return 1;
}

本文讲解了磁盘在使用前的格式化过程,以及不同文件系统如ext4、btrfs、xfs等如何通过特定方式组织文件、管理磁盘空间,确保原子性操作。文章还介绍了文件系统的元数据和日志带来的存储开销,并提供了通过statvfs接口统计存储空间使用的代码样例。
1万+





