Python计算大文件行数方法及性能比较

https://zhuanlan.zhihu.com/p/388265373

如何使用Python快速高效地统计出大文件的总行数, 下面是一些实现方法和性能的比较。

1.readline读所有行
使用readlines方法读取所有行:

2.依次读取每行

依次读取文件每行内容进行计数:

3.sum计数

使用sum函数计数:

4.enumerate枚举计数:

5.buff count

每次读取固定大小,然后统计行数:

6.wc count

调用使用wc命令计算行:

7.partial count

buff_count基础上引入partial:

8.iter count

buff_count基础上引入itertools模块 :

下面是在我本机 4c8g python3.6的环境下,分别测试100m、500m、1g、10g大小文件运行的时间,单位秒:

转自:Python计算大文件行数方法及性能比较-侵删

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值