read, readline, readlines

最新推荐文章于 2025-09-06 09:26:50 发布

weixin_30291791

最新推荐文章于 2025-09-06 09:26:50 发布

阅读量70

点赞数

CC 4.0 BY-SA版权

文章标签： python

原文链接：http://www.cnblogs.com/qihui/p/4244475.html

本文介绍了一种高效处理大文件的方法，并对比了Python中的while循环与for循环在执行速度上的差异，提供了在处理大数据时的优化策略。

read读取指定长度，返回字符串

readline 每次读取一行

readlines 将整个文件读取到内存中。

对于大文件（大于内存）的处理，readline的一行行迭代影响效率。网上看到有个老外给了个很不错的处理办法：

import io

def readInChunks(fileObj, chunkSize=2048):
    """
    Lazy function to read a file piece by piece.
    Default chunk size: 2kB.
    """
    while True:
        data = fileObj.read(chunkSize)
        if not data:
            break
        yield data

f = open('test.txt')
g = open('New Text Document.txt','w')
for chuck in readInChunks(f):
    g.write(chuck)
g.close()