Python基础教程（四十七）文件读写：Python文件读写终极优化指南：告别低效，掌握核心技巧！

最新推荐文章于 2025-11-26 15:40:52 发布

原创最新推荐文章于 2025-11-26 15:40:52 发布 · 297 阅读

CC 4.0 BY-SA版权

文章标签：

99 篇文章

订阅专栏

with open('data.txt', 'r', encoding='utf-8') as f:  # 显式指定编码！
    content = f.read()

字符编码： 乱码根源！务必用encoding参数显式指定（如'utf-8'）。忽略它，Python将使用系统默认编码（可能出错）。
换行符差异： Windows(\r\n), Unix/Linux(\n)。文本模式('t')下，Python默认自动转换换行符为\n。使用newline=''参数可精确控制。
路径处理：

- 相对路径：相对于当前工作目录（os.getcwd()）。
- 绝对路径更可靠。
- 使用os.path.join()构建跨平台兼容路径：os.path.join('dir', 'sub', 'file.txt')。

with open('large.log', 'r') as f:
    for line in f:  # 逐行迭代，内存高效
        process(line)

chunk_size = 1024 * 1024  # 1MB
with open('huge.dat', 'rb') as f:  # 二进制大文件
    while chunk := f.read(chunk_size):
        process_chunk(chunk)

缓冲机制： open()的buffering参数控制缓冲区大小。合理设置（如buffering=8192）可减少磁盘I/O次数，提升读写效率。

with open('data.bin', 'rb+') as f:
    f.seek(10)  # 移动到第10字节
    data = f.read(5)
    f.seek(20)
    f.write(b'NEW')

- f.tell()：获取当前指针位置。
- f.seek(offset, whence)：移动指针。whence=0(文件头)，1(当前位置)，2(文件尾)。对随机访问（如数据库文件）至关重要。

import mmap
with open('massive.data', 'r+b') as f:
    with mmap.mmap(f.fileno(), 0) as mm:
        mm[1000:1024] = b'Updated Data'  # 直接操作内存映射

结语： 精通Python文件读写不仅是掌握API调用，更在于理解编码、资源管理、性能瓶颈与系统特性。善用with保障安全，警惕编码陷阱，对大文件采用迭代或分块策略，活用指针控制与mmap等高级技术，方能构建高效、稳健的数据处理通道，为应用打下坚实基础。