python获取文件的大小适宜open/lseek方法

通常我们通过os.path.getsize()获取文件大小,但本文介绍了一种使用os.lseek()的方法。os.lseek()通过文件描述符调整文件位置,并可以使用SEEK_SET、SEEK_CUR、SEEK_END参数。经验证,os.lseek()与os.path.getsize()在获取文件大小上结果一致。

常规我们所使用的方法是os.path.getsize(),今天见到一个写法是使用os.lseek()函数的方法。于是就特地查了查,然后顺便搞清楚喽。

(1)首先上代码看看lseek是如何使用的:

def file_size(filename):
    '''
    获取给定文件的大小

    @filename - 文件的路径
    Returns 文件的大小
    '''
    # Using open/lseek works on both regular files and block devices
    fd = os.open(filename, os.O_RDONLY)
    try:
        return os.lseek(fd, 0, os.SEEK_END)
    except KeyboardInterrupt as e:
        raise e
    except Exception as e:
        raise Exception("file_size failed to obtain the size of '%s': %s" % (filename, str(e)))
    finally:
        os.close(fd)

lseek()方法语法格式如下:

os.lseek(fd, pos, how)
  • fd -- 文件描述符。

  • pos -- 这是相对于给定的参数 how 在文件中的位置。。

  • how -- 文件内参考位置。SEEK_SET 或者 0 设置从文件开始的计算的pos; SEEK_CUR或者 1 则从当前位置计算; os.SEEK_END或者2则从文件尾部开始。

其中how所对应的参数的话:

  • os.SEEK_SET或者0 :设置文件开始的计算的pos
  • os.SEEK_CUR 或者1:从当前位置开始计算
  • os.SEEK_END或者2:从文件尾部开始计算

SEEK_SET 将读写位置指向文件头后再增加offset个位移量。

SEEK_CUR 以目前的读写位置往后增加offset个位移量。

SEEK_END 将读写位置指向文件尾后再增加offset个位移量。

当whence 值为SEEK_CUR 或SEEK_END时,参数offet允许负值的出现。

下列是较特别的使用方式:

1) 欲将读写位置移到文件开头时:

lseek(int fildes,0,SEEK_SET);

2) 欲将读写位置移到文件尾时:

lseek(int fildes,0,SEEK_END);

3) 想要取得目前文件位置时:

lseek(int fildes,0,SEEK_CUR);

(2)然后我们来比较一下os.sleek()和os.path.getsize()的区别

# -*- coding:utf-8 -*-
# @Author:zgd
# @time:2019/7/29
# @File:test2.py
import os
filename = "/home/ubuntu/zgd/ztest/gs418_510txp_v6.6.2.7.stk"
fopen = os.open(filename, os.O_RDONLY)
fsize = os.lseek(fopen, 0, os.SEEK_END)
fsize2 = os.path.getsize(filename)

print fsize
print fsize2

输出结果:

19681843
19681843

由上面可以看出,输出的结果是一致的,都是以字节的形式输出,输出的字节数相同。

参考链接:

 https://blog.youkuaiyun.com/qq_41660466/article/details/81381532

https://www.runoob.com/python/python-func-super.html

 

<think>嗯,用户想了解如何使用lseek函数来获取文件大小,并且用返回值接收。这个问题看起来是关于文件操作的,特别是在Unix/Linux系统下的系统调用。我需要先回忆一下lseek的功能和相关参数。 首先,lseek的作用是设置文件描述符的偏移量。通常用于移动文件的读写位置,但用户这里想用它来获取文件大小。那应该怎么操作呢?我记得,当使用lseek将偏移量移动到文件末尾,然后返回当前的偏移量,这应该就是文件大小了。对的,所以具体来说,调用lseek(fd, 0, SEEK_END)就能得到从文件开始到末尾的字节数,也就是文件大小。 不过,用户提到要使用返回值接收,所以需要注意lseek的返回值类型。lseek返回的是off_t类型,这是一个有符号整数类型,通常用来表示文件的偏移量。但处理大文件时可能需要考虑是否使用lseek64或者相关的宏定义,比如_FILE_OFFSET_BITS=64,以确保支持大文件。这部分可能需要根据系统环境来调整,但一般情况下,现在的系统默认可能已经支持大文件了。 接下来,要考虑具体的步骤。用户需要先打开文件获取文件描述符fd,然后调用lseek将偏移量移到末尾,并保存返回值作为文件大小。但需要注意的是,这样做之后,文件的当前偏移量会被改变,如果有后续的读写操作,可能需要重新定位。不过如果只是获取大小而不进行其他操作,可能问题不大。或者可以在调用lseek之前保存原来的偏移量,之后再恢复回去,但用户的问题可能不需要这么复杂。 另外,可能存在其他方法获取文件大小,比如使用stat函数,这可能是更常见和推荐的做法,因为直接通过文件元数据获取大小,效率更高,也不会改变文件描述符的状态。但用户可能因为某些原因需要特别使用lseek,比如在无法使用stat的情况下,或者练习系统调用的使用。 然后,我需要考虑可能的错误处理。例如,如果文件描述符无效,或者lseek调用失败,返回值会是-1,这时候需要检查errno来确定错误原因。比如,如果文件不支持寻址(比如管道或套接字),lseek可能会失败,设置errno为ESPIPE。所以在实际应用中,必须检查lseek的返回值是否有效,避免得到错误的大小。 现在,整理一下步骤: 1. 使用open系统调用打开文件获取文件描述符fd。 2. 检查fd是否有效,如果open失败返回-1,需要处理错误。 3. 调用lseek(fd, 0, SEEK_END),将偏移量移到文件末尾,返回值即为文件大小。 4. 关闭文件描述符,使用close(fd)。 5. 处理可能的错误情况,比如lseek返回-1时。 同时,需要给出一个示例代码,用C语言展示这个过程。比如: #include <unistd.h> #include <fcntl.h> #include <stdio.h> int main() { int fd = open("example.txt", O_RDONLY); if (fd == -1) { perror("open failed"); return 1; } off_t size = lseek(fd, 0, SEEK_END); if (size == (off_t)-1) { perror("lseek failed"); close(fd); return 1; } printf("File size: %lld bytes\n", (long long)size); close(fd); return 0; } 需要注意的是,打印off_t类型时,可能需要强制转换为long long,并使用%lld格式,因为off_t的具体类型可能因系统而异,有些系统可能定义为64位整数,而使用long long可以保证足够的空间。 另外,需要提醒用户,这种方法对于某些特殊文件(如设备文件、管道等)可能不适用,或者返回的大小没有实际意义。因此,在真实的应用场景中,建议优先使用stat函数,例如: struct stat st; if (stat("example.txt", &st) == 0) { printf("File size: %lld bytes\n", (long long)st.st_size); } 这样更高效且可靠。不过用户可能特别需要了解lseek方法,所以需要重点解释。 总结来说,使用lseek获取文件大小的关键在于将文件指针移动到末尾并获取此时的偏移量,但需要注意错误处理、文件描述符的状态变化以及适用场景的限制。同时,比较与stat方法的优缺点,帮助用户全面理解。</think>使用 `lseek` 获取文件大小是 Unix/Linux 系统编程中的一种方法,其核心思路是通过调整文件偏移量到文件末尾,并记录此时的偏移值。以下是具体步骤和注意事项: --- ### **1. 核心原理** - **`lseek` 函数**:用于设置文件描述符的偏移量,语法为: ```c off_t lseek(int fd, off_t offset, int whence); ``` 其中: - `fd`:文件描述符(通过 `open` 获取)。 - `offset`:偏移量。 - `whence`:基准位置(`SEEK_SET` 文件开头,`SEEK_CUR` 当前位置,`SEEK_END` 文件末尾)。 - **获取文件大小**:将偏移量定位到文件末尾(`SEEK_END`),此时返回值即为文件总字节数。 --- ### **2. 实现步骤** #### **(1) 打开文件** ```c #include <unistd.h> #include <fcntl.h> int fd = open("filename", O_RDONLY); if (fd == -1) { perror("open failed"); return -1; } ``` #### **(2) 调用 `lseek` 获取大小** ```c off_t file_size = lseek(fd, 0, SEEK_END); if (file_size == (off_t)-1) { // 检查错误 perror("lseek failed"); close(fd); return -1; } ``` #### **(3) 关闭文件** ```c close(fd); printf("File size: %lld bytes\n", (long long)file_size); ``` --- ### **3. 完整示例代码** ```c #include <stdio.h> #include <unistd.h> #include <fcntl.h> int main() { int fd = open("example.txt", O_RDONLY); if (fd == -1) { perror("open failed"); return 1; } off_t size = lseek(fd, 0, SEEK_END); if (size == (off_t)-1) { perror("lseek failed"); close(fd); return 1; } printf("File size: %lld bytes\n", (long long)size); close(fd); return 0; } ``` --- ### **4. 注意事项** 1. **文件描述符权限**:需以可读模式(如 `O_RDONLY`)打开文件,否则 `lseek` 可能失败。 2. **大文件支持**: - 若文件大小超过 2GB,需定义 `_FILE_OFFSET_BITS=64`(编译时添加 `-D_FILE_OFFSET_BITS=64`)或使用 `lseek64`。 3. **不修改文件状态**: - `lseek` 仅调整偏移量,不会修改文件内容,但后续读写操作需手动重置偏移量(如需从头读取)。 4. **特殊文件限制**: - 对管道、套接字等无实际大小文件,`lseek` 可能返回错误(`errno=ESPIPE`)。 --- ### **5. 替代方案(推荐)** 使用 `stat` 函数直接获取文件元信息,效率更高且无需操作文件描述符: ```c #include <sys/stat.h> struct stat st; if (stat("example.txt", &st) == 0) { printf("File size: %lld bytes\n", (long long)st.st_size); } ``` --- ### **总结** - **适用场景**:临时获取文件大小且无需频繁读取文件内容。 - **缺点**:需手动处理文件描述符,且不适合特殊文件。 - **推荐方案**:优先使用 `stat`,更简洁高效。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值