多线程分块(按行进行)读取多个文件

本文介绍了如何利用多线程技术高效地分块读取大文件,特别是按行进行操作,适合处理大量数据的场景。通过实例展示了如何将文件分割成多个部分,并在不同线程中并行读取,从而提高文件读取速度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

"""
多线程分块(按行进行)读取多个文件
1、统计文件的行数
2、根据线程数对文件行数进行分块
3、多线程根据分块行进行读取文件
"""
import os
from concurrent.futures.thread import ThreadPoolExecutor
import time


def wc_file(file):
    """
    统计文件行数
    :return:
    """
    count = 0
    for index, line in enumerate(open(file, "r", encoding="gbk", errors="ignore")):
        count += 1
    return count


def part_wc_file(file, thread_num):
    """
    根据统计的行数对文件按行进行分块
    :return:
    """
    rows_count = wc_file(file)
    num = rows_count // thread_num  # 计算每块的行数
    i = 1
    tt = []  # 存放分块的行数
    t = 0
    while i <= thread_num - 1:
        tt.append((t + 1, i * num))
        t = i * num
        i += 1
    tt.append((t + 1, rows_count))
    return tt


def Read_file(args):
    """
    分块读取文件
    :param tt:
    :param file:
    :return:
    """
    # print(args[0][0], args[0][1])
    count = 0
    with open(args[1], "r", encoding="gbk", errors="ignore") as f:
        for line in f:
            count += 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值