Linux下，删除大于固定大小的文件

最新推荐文章于 2024-06-25 21:14:14 发布

凯_

最新推荐文章于 2024-06-25 21:14:14 发布

阅读量1w

点赞数 2

CC 4.0 BY-SA版权

分类专栏： Linux

本文链接：https://blog.youkuaiyun.com/kai165416/article/details/79449638

Linux 专栏收录该内容

8 篇文章

订阅专栏

本文介绍如何使用find命令来查找当前目录及其子目录下大小超过50MB的文件，并提供了执行删除这些文件的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

find ./ -size +50M

显示当前路径下，大于50M的文件。（包含子文件夹内的文件）

find ./ -size +50M -exec rm {} \;

删除当前路径下，大于50M的文件。（包含子文件夹内的文件）

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

凯_

关注关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Linux脚本根据文件大小删除,Shell脚本扫描文件系统，根据指定条件删除文件（根据文件大小删除）...

weixin_29532367的博客

05-05

662

因程序执行过程中生成大量的日志，导致日志文件迅速增大，占用大量磁盘空间，影响到程序正常运行，程序执行速度减慢在指定文件中保存目录路径，并指定删除条件(如：大小值，特定字符串正则表达式、日期正则表达式)，运行脚本读取该文件，若符合条件，则删除该文件。• 实现：1.根据文件大小删除文件，运行脚本，大于指定值的文件被删除脚本实现代码如下：#!/bin/bashParamSize=$2defaultSiz...

linux删除指定大小的文件,Linux下删除空文件，删除指定大小的文件

weixin_32860759的博客

04-29

1273

Linux下批量删除空文件(大小等于0的文件)的方法：find . -name "*" -type f -size 0c | xargs -n 1 rm -f用这个还可以删除指定大小的文件，只要修改对应的 -size 参数就行，例如：find . -name "*" -type f -size 1024c | xargs -n 1 rm -f就是删除1k大小的文件。(但注意不要用 -size 1...

参与评论您还未登录，请先登录后发表或查看评论

linux删除指定大小的文件,Linux怎么清空与删除指定大小文件

weixin_39750410的博客

04-29

882

Linux怎么清空与删除指定大小文件？//----注意可能由于复制粘贴的原因，一下指令有时候会报错find: missing argument to `-exec'。请手工输入1，查找大文件find /dir -size +100M -exec ls -lh {} ＼;直接删除大于50M的文件，使用命令：find /var/mail/ -size +50M -exec rm {} ＼;清空一些文本...

Linux怎么清空与删除指定大小文件

skylinethj的专栏

05-07

8214

Linux怎么清空与删除指定大小文件？ //----注意可能由于复制粘贴的原因，一下指令有时候会报错find: missing argument to `-exec'。请手工输入 1，查找大文件复制代码代码示例: find /dir -size +100M -exec ls -lh {} ＼; 直接删除大于50M的文件，使用命令：复制代码代码示例:

如何在 Linux 中删除超大的（100-200GB）文件

因上努力，果上随缘。但行好事，莫问前程。

11-18

3459

空闲磁盘调度；该调度策略是在当前系统没有其他进程需要进行磁盘IO时，才能进行磁盘；因此该策略对当前系统的影响基本为0；当然，该调度策略不能带有任何优先级参数；

linux 查找所有文件,LINUX 下查找指定时间的所有文件

weixin_34638776的博客

04-28

3529

1find.-name"*.txt"-mtime-1//以上为1小时以内的当前目录内修改的所有为txt格式的文件. 其中-1为1小时以内, +1为1小时之前find . -mmin -10 //查找10分钟内当前目录内修改的所有文件1find.-mmin-10//查找10分钟内当前目录内修改的所有文件find . -mmin +10 //查找1小时内,10分钟外当前目录内修改的所有文件1find....

Shell脚本删除自动清理超过大小的文件(2)

2401_83946826的博客

04-28

391

dev/null：将正确信息丢弃2> /var/delete：将错误信息报错到文件内，方便管理员查看最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！

嵌入式Linux系统编程 — 1.2 文件管理与错误处理

几度春风里的博客

06-03

1213

在Linux中，错误处理通常通过返回一个错误代码来实现，而更具体的错误信息则存储在全局变量errno中。errno是一个宏，它在头文件<errno.h>中定义。当系统调用或库函数失败时，它们会设置errno为特定的错误代码。调用系统函数：执行如打开文件、读取数据等操作。检查返回值：如果函数返回-1或其他错误指示值，表示函数执行失败。检查errno：调用perror()strerror()或函数来获取errno对应的错误描述。错误处理。

基于Linux的海量文件存储引擎

weixin_44155149的博客

06-25

624

这个宏的作用主要是为了解决不同平台（特别是32位和64位系统）下整数类型表示和格式化输出的问题。32位机输出64位int，printf中应为%lld64位机输出64位int，printf中应为%ld32位、64位机可以统一使用__PRI64_PREFIX来输出64位int因为很多模块都要用到索引文件，所以在common.h中定义1.块信息BlockInfo//块编号//块当前版本号//当前已保存文件总数//当前已保存文件数据总大小//已删除的文件数量//已删除的文件数据总大小。

JFFS和YAFFS两种文件系统在嵌入式Linux平台上的运行比较.pdf

09-06

它将文件组织成固定大小的页，并采取先写入新的数据块，再删除旧的数据块的方式，防止了宕机、断电情况下，数据完整性被破坏。YAFFS 文件系统实现了文件的修改以及永久存储，支持大容量闪存；支持错误检测和纠正，...

linux 删除当前目录下大小为0的文件

02-02

shell 删除大小为0文件，不需要参数，直接在需要清除文件的目录下执行即可

如何快速清空 Linux 中的文件或大文件？

2401_83916030的博客

04-21

1400

关于分布式，限流+缓存+缓存，这三大技术（包含：ZooKeeper+Nginx+MongoDB+memcached+Redis+ActiveMQ+Kafka+RabbitMQ）等等。这些相关的面试也好，还有手写以及学习的笔记PDF，都是啃透分布式技术必不可少的宝藏。以上的每一个专题每一个小分类都有相关的介绍，并且小编也已经将其整理成PDF啦《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取！

清理目录下大于10m_磁盘清理--find

weixin_39516865的博客

01-27

435

简介： Linux find命令用来在指定目录下查找文件。任何位于参数之前的字符串都将被视为欲查找的目录名。如果使用该命令时，不设置任何参数，则find命令将在当前目录下查找子目录与文件。并且将查找到的子目录和文件全部进行显示。语法： find path -option [ -print ] [ -exec -ok command ] {} ;常用到的场...

技能包！Linux 下清空或删除大文件内容的 5 种方法

markzhy的博客

03-15

452

在 Linux 中， null 设备基本上被用来丢弃某个进程不再需要的输出流，或者作为某个输入流的空白文件，这些通常可以利用重定向机制来达到，所以 /dev/null 设备文件是一个特殊的文件，它将清空送到它这里来的所有输入，而它的输出则可被视为一个空文件。基于这个原因，当你将 echo命令的输出作为输入重定向到文件后，使用cat命令来查看该文件的内容时，你将看到一个空白行（即一个空字符串）。由于再Linux中一切皆文件，你需要时刻注意，确保你将要清空的文件不是重要的用户文件或者系统文件。

linux删除当前查询的文件,在Linux系统中查找和删除超过n天的文件

weixin_39761647的博客

04-28

307

在本文中我们将介绍如何在Linux系统中删除超过n天的文件，方法非常的简单，使用find命令和rm命令配合，最常见的用例是删除早于特定天数的轮换日志或删除旧备份以清除空间以进行最近的备份。查找和删除超过n天文件的方法1、让我们看一个例子，我将在/var/log下搜索扩展名为.tar.gz且超过7天的文件并删除它们，我将使用find命令搜索文件：# find /var/log/ -name *.gz...

如何在 Linux 中删除大于或小于 X 大小的文件

网络技术联盟站

04-24

1278

在Linux系统中，删除大于某个特定大小的文件是一项常见的任务。本节将详细介绍使用find命令来实现这一目标。

centos 查找超过200M的文件并将其删除

tiging的博客

05-02

1001

find / -type f -size +200M | xargs rm -rf 其中第一个/表示路径，此时表示的是根目录，也就是搜索全部的文件 -type表示类型 f表示是文件 -size 表示大小 +200M：表示大于200M 后面就是执行的命令。当然也可以寻找特定后缀的文件，比如：find / -name “*.apk” |xargs rm -rf，就是寻找以apk结尾的文件并删除。一般我们在删除之前需要确认删除的文件是否正确，所以我们一般是去掉后面的执行命令，先找出文件列表，再执行

Linux命令：删除home目录下所有大小超过100M的文件

qq_58158950的博客

10-09

778

命令：查找符合条件的文件。

linux命令-寻找超过100M的文件，并将其删除

02-15

4829

find / -type f -size +100M | xargs rm -rf其中第一个/表示路径，此时表示的是根目录，也就是搜索全部的文件-type表示类型f表示是文件-size 表示大小+100M：表示大于100M后面就是执行的命令。当然也可以寻找特定后缀的文件，比如：find / -name “*.mp3” |xargs rm -rf，就是寻找以mp3结尾的文件并删除。一般我们在删除之前

然后还需要一个限制，就是当文件大小超过5mb的时候，我需要把前面的一些内容删掉，保证我这个日志文件的内容在5mb以内

最新发布

07-25

<think>我们计划实现一个日志文件大小限制功能，当文件超过5MB时，删除部分内容（例如删除文件的前半部分内容）以保留最新内容，使得文件总大小保持在5MB以内。注意：我们不是删除整个文件，而是删除文件的前一部分内容（即保留文件末尾的部分内容），这样保留的是最新的日志。思路： 1. 每次写入日志前检查文件大小。 2. 如果文件大小超过5MB，则进行截断处理：读取文件的后半部分（例如2.5MB）内容，然后写回文件（这样文件大小变为2.5MB），然后再写入新的日志。但是注意：如果超过5MB，我们想保留最新的5MB内容，那么我们可以保留最后5MB的内容，但是这样每次超限都要移动大量数据，效率不高。 3. 另一种思路：我们每次只保留文件最后5MB的内容，当超过5MB时，我们只保留最后5MB，删除前面的部分。具体步骤： - 打开文件（以读写模式打开，O_RDWR） - 使用fstat获取文件大小 - 如果文件大小超过5MB（5*1024*1024字节），则： a. 计算需要保留的起始位置：偏移量 = 文件大小 - 5MB? 但是这样会保留超过5MB的内容，因为我们要保留的是最新的内容，所以我们可以保留最后4.5MB（或者4MB）？不对，我们要保留最新的内容，并且希望文件大小不超过5MB。实际上，我们想保留最后5MB的内容，但是如果我们保留5MB，那么加上新写入的内容就会超过。所以我们可以保留一个小于5MB的大小，比如保留4.5MB，然后写入新的日志后，总大小不会超过5MB？但是这样每次都要保留4.5MB，然后写入0.5MB，这样总大小就是5MB。但是这样操作频繁的话，效率低。更合理的做法：我们设定一个阈值（比如5MB），当文件超过5MB时，我们删除文件的前一半内容（这样文件大小变为原来的一半），直到文件大小小于5MB。但是这样可能会导致文件大小在2.5MB到5MB之间波动。但是，我们要求的是文件大小保持在5MB以内，所以我们可以这样做： - 当文件大小超过5MB时，我们只保留文件最后5MB的内容（即删除5MB之前的内容），这样文件大小就变成5MB（或者略小于5MB，因为我们保留的是从当前文件末尾往前5MB的位置开始到末尾的内容）。然后我们再写入新的日志，这样写入后文件大小会超过5MB，然后我们再次截断。这样会导致每次写入后如果超过5MB就截断，效率不高，但简单。具体步骤： - 使用fstat获取文件大小，假设为current_size。 - 如果current_size >= 5MB，那么： 1. 计算要保留的数据量：保留5MB？不行，因为我们要保留最新的内容，所以应该保留从文件末尾往前5MB开始到末尾的内容。但是注意，我们可能不能保留整5MB，因为可能新日志写入后又会超过，所以我们可以保留比5MB小一点，比如保留4.5MB，这样给新日志留出空间。但是这样处理复杂。另一种方法：我们每次检查到文件超过5MB，就删除文件的前半部分（直到文件大小小于5MB）。但是这样保留的是后半部分，也就是最新的部分。具体删除前半部分的方法： - 将文件指针移动到文件中间（比如从文件开头偏移掉需要删除的部分，然后读取剩余部分，再写回文件开头，然后截断文件）。但是这样需要移动大量数据。我们可以使用以下步骤： 1. 将文件指针移动到要保留部分的起始位置（比如文件大小的一半，或者文件大小-4.5MB的位置）。 2. 读取从该位置到文件末尾的所有数据。 3. 将读取到的数据写回到文件的开头。 4. 使用ftruncate将文件截断为当前写入的大小。但是这样操作在文件很大时，读取和写入的数据量很大，效率不高。考虑到日志文件通常不会频繁达到5MB，我们可以接受这种操作。具体实现： - 使用lseek定位到要保留的位置（比如current_size - 4.5MB，但是我们要保留最新的内容，所以应该是从文件开头偏移掉前面的一部分，保留后面的4.5MB）。 - 注意：我们保留的是文件末尾的4.5MB，那么起始位置 = current_size - 4.5MB，然后读取从该位置开始的4.5MB数据，然后写入到文件开头，再截断文件为4.5MB。但是这样操作后，文件大小变为4.5MB，然后我们继续写入新的日志，这样文件大小就会增加，直到再次超过5MB，然后再进行同样的操作。步骤： 1. 打开文件（使用open函数，模式为O_RDWR） 2. 使用fstat获取文件大小 3. 如果文件大小超过5MB（5*1024*1024），则： off_t new_start = current_size - 4.5 * 1024 * 1024; // 从文件开头跳过这么多，然后开始保留 // 但是注意，new_start可能为负数，所以需要判断 if (new_start < 0) new_start = 0; // 分配一个缓冲区，大小为4.5MB char *buf = malloc(4.5*1024*1024); if (buf == NULL) { /* 错误处理 */ } // 将文件指针定位到new_start lseek(fd, new_start, SEEK_SET); // 读取剩余部分（从new_start到文件末尾）的数据 ssize_t bytes_remaining = current_size - new_start; ssize_t nread = read(fd, buf, bytes_remaining); if (nread != bytes_remaining) { /* 错误处理 */ } // 现在将文件指针移回文件开头 lseek(fd, 0, SEEK_SET); // 将读取到的数据写入文件 ssize_t nwrite = write(fd, buf, nread); if (nwrite != nread) { /* 错误处理 */ } // 截断文件到nread大小 ftruncate(fd, nread); free(buf); 4. 然后就可以继续写入新的日志内容。但是这种方法在文件很大时（比如远超过5MB）会分配4.5MB的缓冲区，并且需要读取和写入4.5MB的数据。如果内存有限，我们可以分块读写，但是这样代码复杂。另一种高效的方法：使用mmap。但是这里我们假设文件不是特别大（最大5MB），所以使用内存缓冲区可以接受。注意：我们每次写入日志前都要检查文件大小，所以可以在写入函数中调用一个截断函数。但是，如果日志写入很频繁，这个操作可能会比较耗时。我们可以优化为：当文件大小超过5MB时才进行截断，并且我们设定一个保留大小（比如4.5MB），这样每次截断后，文件大小变为4.5MB，然后可以继续写入0.5MB才会再次触发截断。代码结构： void truncate_log(int fd) { struct stat st; fstat(fd, &st); off_t current_size = st.st_size; const off_t max_size = 5 * 1024 * 1024; const off_t keep_size = 4.5 * 1024 * 1024; // 保留的大小 if (current_size < max_size) { return; } // 计算要保留的起始位置 off_t start_pos = current_size - keep_size; if (start_pos < 0) { start_pos = 0; keep_size = current_size; // 但实际保留的大小为整个文件 } // 分配缓冲区 char *buf = malloc(keep_size); if (!buf) { // 处理错误，比如直接截断为0？或者保留？这里我们返回 return; } // 定位到start_pos if (lseek(fd, start_pos, SEEK_SET) == (off_t)-1) { free(buf); return; } ssize_t nread = read(fd, buf, keep_size); if (nread <= 0) { free(buf); return; } // 将读取到的内容写回文件开头 if (lseek(fd, 0, SEEK_SET) == (off_t)-1) { free(buf); return; } ssize_t nwrite = write(fd, buf, nread); if (nwrite != nread) { // 写入出错，可以选择截断到已经写入的位置 ftruncate(fd, nwrite); free(buf); return; } // 截断文件 ftruncate(fd, nread); free(buf); } 然后，在每次写入日志前调用这个函数。但是，注意：这样操作后，文件指针的位置在哪里？我们在写入日志前，应该将文件指针定位到文件末尾，因为我们是要追加日志。所以，在调用truncate_log之后，我们应该将文件指针定位到文件末尾： lseek(fd, 0, SEEK_END); 另外，我们也可以使用O_APPEND模式打开文件，这样每次写入都会到文件末尾，但是我们在truncate_log函数中移动了文件指针，所以需要重新定位。但是，在truncate_log函数中，我们通过lseek移动了文件指针，然后写入数据，最后文件指针在文件末尾吗？不是，我们在写入数据后，文件指针在写入结束的位置（即nread处），然后我们又调用了ftruncate，所以文件指针的位置是不确定的。因此，在调用完truncate_log后，我们需要将文件指针定位到文件末尾。完整流程： int fd = open("log.txt", O_RDWR | O_CREAT, 0644); // ... 其他初始化 while (需要写入日志) { truncate_log(fd); // 检查并截断 // 定位到文件末尾 lseek(fd, 0, SEEK_END); // 写入新的日志 write(fd, buffer, len); } 但是，这样每次写入前都要检查，可能会影响性能。我们可以优化为：每隔若干次写入检查一次，或者当写入前检查当前文件大小（通过fstat）已经超过5MB才调用。注意：在truncate_log函数中，我们使用了fstat，然后在里面又进行了读写操作，所以效率不高。如果日志写入很频繁，我们可以记录当前文件大小，避免每次都调用fstat。另一种方法：我们记录当前文件大小，每次写入时增加写入的字节数，然后检查这个大小是否超过5MB。如果超过，再调用truncate_log，并在truncate_log中更新这个大小（因为截断后文件大小变了）。但是，这样要注意其他进程可能也在写入这个文件，所以如果我们不是独占这个文件，那么记录的大小就不准确。因此，我们每次还是需要fstat来获取准确的大小。如果只有本进程写入，那么我们可以自己记录文件大小。考虑到简单性，我们每次写入前都fstat一次。但是，为了性能，我们可以在每次写入前先fstat，然后判断大小，如果小于5MB，就不调用truncate_log。如果大于等于5MB，再调用truncate_log（在truncate_log内部再进行一次fstat，因为可能已经变化了？或者我们传入当前大小）。修改truncate_log函数，传入当前大小： void truncate_log(int fd, off_t current_size) { const off_t max_size = 5 * 1024 * 1024; const off_t keep_size = 4.5 * 1024 * 1024; if (current_size < max_size) { return; } // 然后和之前一样，但是注意：在truncate_log中，我们读取文件前，文件大小可能已经改变（比如被其他进程写入），所以这里我们最好重新获取一次？或者我们假设只有本进程写入，那么current_size就是准确的。 // 为了安全，我们可以在函数内部重新获取文件大小，但是这样就需要两次fstat。或者我们要求调用者保证当前_size是准确的（即没有其他进程写入）。 // 这里我们假设只有本进程写入，所以使用传入的current_size。 // ... 后续操作 } 然后： while (需要写入日志) { struct stat st; fstat(fd, &st); off_t current_size = st.st_size; truncate_log(fd, current_size); // 定位到文件末尾 lseek(fd, 0, SEEK_END); // 写入新的日志 write(fd, buffer, len); } 但是，在truncate_log中，我们修改了文件，所以文件大小已经改变，因此我们还需要更新外部记录的current_size。但是外部没有记录，所以下次循环会重新获取。这样设计可以。但是，如果多个线程同时写入，则需要加锁。这里假设单线程。完整代码示例：注意：我们使用4.5MB作为保留大小，这样每次截断后，文件大小为4.5MB，然后可以继续写入0.5MB，这样不会频繁触发截断操作。但是，如果一次写入的数据量很大（比如1MB），那么写入后文件大小变为5.5MB，然后我们截断保留4.5MB，这样就会丢失最后一次写入的一部分数据？不对，因为我们在写入前检查并截断，然后写入新的数据，所以写入后文件大小是4.5MB+本次写入的数据量。如果本次写入的数据量超过0.5MB，那么写入后文件大小会超过5MB，但是要等到下一次写入前才会截断。所以，如果一次写入的数据量很大（比如超过5MB），那么写入后文件大小会超过5MB，但是不会立即截断，直到下一次写入前。这样可能会导致文件暂时超过5MB，但不会超过5MB+单次写入的最大数据量。如果要求文件大小绝对不能超过5MB，那么我们需要在每次写入前确保写入后不会超过5MB。怎么做呢？可以在写入前先截断，然后检查写入后是否会超过5MB，如果会，那么再截断一次（保留更少的内容）？这样会复杂。考虑到日志通常是文本行，单次写入不会太大（比如一行最多几KB），所以我们可以接受暂时超过一点。因此，我们按照上述思路实现。代码：注意：保留大小keep_size不能超过max_size，我们设置为4.5MB，所以max_size是5MB，这样每次截断后文件大小为4.5MB，然后写入0.5MB的数据，不会超过5MB。但是，如果单次写入超过0.5MB，那么写入后就会超过5MB。所以，如果单次写入可能很大（比如超过0.5MB），那么我们可以将keep_size设置得更小，比如保留max_size - 单次最大写入量，但是这样可能保留的大小很小。我们可以这样：在写入前，如果当前文件大小加上本次要写入的字节数大于max_size，那么我们就截断，使得截断后的文件大小加上本次写入大小不超过max_size。但是这样就需要在truncate_log函数中考虑本次写入的大小。为了简单，我们假设单次写入不会超过0.5MB（即512KB），所以使用4.5MB作为保留大小。如果单次写入可能超过0.5MB，那么我们可以修改truncate_log函数，根据本次要写入的数据量来调整保留大小： off_t keep_size = max_size - len; // 保留的大小，使得写入后不超过max_size if (keep_size < 0) { // 如果写入的数据量已经超过max_size，那么我们就只保留最后max_size的数据（即从本次写入的数据的末尾往前max_size开始保留，但是这样会丢弃一部分新数据？） // 或者我们保留最后max_size的数据，但是这样会丢弃旧数据和新数据的一部分？不合理。 // 所以，如果len超过max_size，那么我们就保留最后max_size的数据（即只保留本次写入的最后max_size字节） // 但是这样会导致之前的数据全部丢失，并且本次写入也只保留一部分。 // 因此，我们可以将整个文件替换为本次写入的最后max_size字节。 // 但是这样会丢失之前的所有日志，所以我们要权衡。 // 这里我们简单处理：如果len超过max_size，那么保留本次写入的最后max_size字节，然后写入文件（这样文件大小就是max_size） // 然后直接返回，不再保留旧数据。 } 这样处理比较复杂，所以我们假设单次写入不会超过0.5MB。因此，我们按照固定保留4.5MB来实现。完整代码示例：注意：以下代码为示例，没有进行错误处理的完善，实际使用中需要完善错误处理。 ```c #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <fcntl.h> #include <sys/stat.h> #include <sys/types.h> #include <string.h> #define MAX_LOG_SIZE (5 * 1024 * 1024) // 5MB #define KEEP_SIZE (4.5 * 1024 * 1024) // 保留4.5MB void truncate_log(int fd, off_t current_size) { if (current_size < MAX_LOG_SIZE) { return; } // 计算要保留的起始位置：从文件末尾往前KEEP_SIZE的位置 off_t start_pos = current_size - KEEP_SIZE; if (start_pos < 0) { start_pos = 0; } // 实际要保留的数据量 off_t keep_bytes = current_size - start_pos; // 分配缓冲区 char *buf = (char*)malloc(keep_bytes); if (!buf) { // 分配失败，直接截断文件为0？或者保留？这里我们截断为0（清空日志）作为应急处理 ftruncate(fd, 0); return; } // 定位到start_pos if (lseek(fd, start_pos, SEEK_SET) == (off_t)-1) { free(buf); return; } // 读取要保留的数据 ssize_t nread = read(fd, buf, keep_bytes); if (nread != keep_bytes) { // 读取失败，可能只读取了一部分，我们只保留能读取到的部分 if (nread <= 0) { free(buf); return; } keep_bytes = nread; // 实际保留的数据量 } // 将读取到的数据写回文件开头 if (lseek(fd, 0, SEEK_SET) == (off_t)-1) { free(buf); return; } ssize_t nwrite = write(fd, buf, keep_bytes); // 无论是否完全写入，我们都根据实际写入的字节数截断 if (nwrite < 0) { nwrite = 0; } if (ftruncate(fd, nwrite) == -1) { // 截断失败 } free(buf); } int main() { const char *logfile = "app.log"; int fd = open(logfile, O_RDWR | O_CREAT, 0644); if (fd < 0) { perror("open log file failed"); return 1; } // 模拟写入日志 for (int i = 0; i < 10000; i++) { // 获取当前文件大小 struct stat st; if (fstat(fd, &st) == -1) { perror("fstat failed"); break; } off_t current_size = st.st_size; // 检查并截断 truncate_log(fd, current_size); // 定位到文件末尾 lseek(fd, 0, SEEK_END); // 生成日志内容 char log_buffer[256]; int len = snprintf(log_buffer, sizeof(log_buffer), "Log entry %d: This is a test log message.\n", i); // 写入日志 write(fd, log_buffer, len); // 为了演示，每次写入后睡眠一下 usleep(10000); // 10ms } close(fd); return 0; } ``` 注意：这个示例中，每次写入前都调用fstat，然后调用truncate_log，然后写入。这样效率不高，但作为示例。另外，truncate_log函数中，如果读取和写入不完整，我们做了简单的处理，实际应用中可能需要更健壮的错误处理。优化：我们可以自己记录文件大小（比如用一个全局变量），这样避免频繁调用fstat。但是要注意，如果其他进程也在写入，那么记录就不准确。所以如果只有本进程写入，那么可以自己记录。最后，如果日志文件很重要，我们也可以考虑使用syslog或者成熟的日志库，它们通常支持日志轮转和大小限制。 ### 相关问题 1. 如何实现日志文件的自动轮转（例如按日期或大小分割）？ 2. 在Linux C中如何实现多线程安全的日志写入？ 3. 如何优化大日志文件截断操作的性能？ 4. Linux系统中有哪些成熟的日志管理工具（如logrotate）？ 5. 如何通过文件锁实现多进程安全写入同一日志文件？ [^1]: 参考logrotate的运行机制，它通过cron定期执行日志轮转任务。 [^2]: 日志文件对于系统安全至关重要，logrotate是管理日志文件的常用工具。 [^3]: logrotate支持多种参数，如按大小、日期轮转，压缩旧日志等。 [^4]: cron任务配置在/var/spool/cron目录下，每个用户有自己的crontab文件。</think>### Linux C 实现日志文件大小限制（超过5MB自动截断保留最新内容）在 Linux C 环境中实现日志文件大小限制功能，可通过以下步骤完成。核心思路是：**每次写入日志前检查文件大小，若超过5MB则截断文件前半部分，只保留最新的内容**。 #### 完整代码实现 ```c #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <fcntl.h> #include <sys/stat.h> #include <string.h> #include <errno.h> #define MAX_SIZE (5 * 1024 * 1024) // 5MB #define KEEP_SIZE (4 * 1024 * 1024) // 保留4MB最新内容 // 截断日志文件保留最新内容 void truncate_log(int fd, off_t current_size) { // 计算需要保留的数据量（取MAX_SIZE和KEEP_SIZE的较小值） off_t keep_bytes = (current_size > MAX_SIZE) ? KEEP_SIZE : current_size; if (keep_bytes <= 0) return; // 分配缓冲区 char *buf = malloc(keep_bytes); if (!buf) { perror("malloc failed"); return; } // 定位到保留起始位置 off_t start_pos = current_size - keep_bytes; if (lseek(fd, start_pos, SEEK_SET) == (off_t)-1) { perror("lseek failed"); free(buf); return; } // 读取需要保留的数据 ssize_t nread = read(fd, buf, keep_bytes); if (nread != keep_bytes) { perror("read failed"); free(buf); return; } // 将数据写回文件开头 if (lseek(fd, 0, SEEK_SET) == (off_t)-1) { perror("lseek failed"); free(buf); return; } ssize_t nwrite = write(fd, buf, nread); if (nwrite != nread) { perror("write failed"); } // 截断文件 if (ftruncate(fd, nread) == -1) { perror("ftruncate failed"); } free(buf); } int main() { const char *filename = "app.log"; int fd = open(filename, O_RDWR | O_CREAT | O_APPEND, 0644); if (fd == -1) { perror("open failed"); return 1; } // 模拟日志写入 for (int i = 0; i < 1000; i++) { // 获取当前文件大小 struct stat st; if (fstat(fd, &st) == -1) { perror("fstat failed"); break; } // 超过5MB时截断保留最新内容 if (st.st_size > MAX_SIZE) { truncate_log(fd, st.st_size); } // 定位到文件末尾 lseek(fd, 0, SEEK_END); // 写入新日志 char log_entry[256]; int len = snprintf(log_entry, sizeof(log_entry), "Log %d: This is a sample log entry at timestamp %ld\n", i, time(NULL)); write(fd, log_entry, len); // 控制写入速度 usleep(10000); // 10ms } close(fd); return 0; } ``` #### 关键函数解析 1. **文件截断核心逻辑**： ```c void truncate_log(int fd, off_t current_size) { off_t keep_bytes = (current_size > MAX_SIZE) ? KEEP_SIZE : current_size; // ... [读取文件后半部分数据] // ... [将数据移至文件开头] ftruncate(fd, nread); // 截断文件 } ``` - 保留最新4MB内容（可调整`KEEP_SIZE`） - 使用`lseek`+`read`获取需要保留的数据 - 通过`ftruncate`完成最终截断[^3] 2. **文件状态检查**： ```c struct stat st; fstat(fd, &st); // 获取文件信息 if (st.st_size > MAX_SIZE) // 检查大小 ``` - 使用`fstat`获取文件精确大小 - 每次写入前进行检查 3. **安全写入机制**： ```c lseek(fd, 0, SEEK_END); // 确保写入位置在文件末尾 write(fd, buffer, len); // 追加新日志 ``` #### 编译与运行 ```bash gcc log_truncate.c -o log_truncate ./log_truncate ``` #### 高级优化建议 1. **添加时间戳**： ```c #include <time.h> time_t now = time(NULL); char timestamp[20]; strftime(timestamp, 20, "%Y-%m-%d %H:%M:%S", localtime(&now)); ``` 2. **信号处理实现优雅退出**： ```c #include <signal.h> volatile sig_atomic_t stop = 0; void handle_signal(int sig) { stop = 1; } // 在main()中注册信号 signal(SIGINT, handle_signal); while (!stop) { /* 主循环 */ } ``` 3. **性能优化**： - 使用`mmap`内存映射替代`read/write` - 添加写入频率控制（如每10条日志检查一次大小） - 自记录文件大小避免频繁`fstat` #### 日志轮转替代方案（系统级工具）对于生产环境，推荐使用Linux自带的`logrotate`工具，配置示例： ```conf # /etc/logrotate.d/app_logs /var/log/app.log { size 5M # 超过5MB时轮转 rotate 4 # 保留4个历史版本 compress # 压缩旧日志 delaycompress # 延迟压缩 missingok # 文件不存在时不报错 notifempty # 空文件不轮转 create 0644 root root } ``` 优势： - 自动压缩旧日志 - 支持按大小/时间轮转 - 通过cron定时执行[^1][^4] - 支持邮件通知和自定义脚本[^3] #### 相关问题 1. 如何实现按日期分割日志文件而不是按大小？ 2. 在多进程环境下如何安全地写入同一个日志文件？ 3. 怎样在C程序中直接调用logrotate实现日志轮转？ 4. 如何优化大文件截断操作的性能？ 5. Linux系统中有哪些实时监控日志文件变化的工具？ > 引用说明：本实现参考了Linux文件系统API[^3]和logrotate设计理念[^1][^4]，通过文件截断(ftruncate)和定位(lseek)实现日志大小控制，同时给出生产环境更优的系统级解决方案[^2]。