python写入一个文件之前可以不打开_Python:当写入一个大文件时,保持文件打开,或者根据需要打开并附加到文件中?...

本文探讨了在Python中处理大文件的三种策略:保持文件打开并追加写入,每次写入时打开并追加,以及使用awk处理。作者通过循环调用外部Fortran程序,读取其输出并进行简单处理,然后写入最终输出文件。文章讨论了这些方法的开销和潜在的性能影响,并寻求针对大型循环的最佳解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我想知道如何最好地处理用python编写大文件。

我的python代码多次循环运行外部程序(古代Fortran,输入文件格式怪异),读取其输出(单行文件)执行一些非常简单的处理,并写入编译后的输出文件。外部程序执行速度快(大大低于1秒)。import subprocess as sp

f_compiled_out = open("compiled.output", "w")

for i in range(len(large_integer)):

write_input_for_legacy_program = prepare_input()

sp.call(["legacy.program"])

with open("legacy.output", "r") as f:

input = f.readline()

output = process(input)

f_compiled_out.write(output)

close(f_compiled_out)

我可以想到三个选项来生成编译后的输出文件。我已经在做什么了。

在主循环的每个循环上使用with open("comiled.output", "a") as f: f.write(output)打开已编译的

使用awk进行简单的处理,并将输出分类到“compiled.output”结尾。

那么,(1)保持一个大文件的打开并将其写入到文件的末尾,与(2)每次写入时打开并附加到文件,与(3)使用awk进行处理和cat建立“compiled.output”的开销是多少呢。

在任何阶段,整个输出都不需要在内存中。

如果有人能看到任何其他明显的事情,会减缓这一速度,因为N}u循环变大,这也将是可怕的!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值