Python 使用flush函数将缓冲区数据立即写磁盘

本文探讨了Python后台服务中日志实时输出的问题,并通过代码示例展示了如何利用flush函数确保数据实时写入磁盘。讨论了频繁使用flush函数可能导致的性能问题,以及如何在服务访问量不大的情况下进行权衡。

1 问题

在后台领域,经常用python做一些简单服务,实现起来速度较快、变化较灵活,相比C++,成本要低很多。作为后台服务,在观察服务运行情况时,都希望服务能够实时输出日志数据,以便观察。之前我用python写的一个服务,发现就没有实时把数据写到磁盘,导致在观察数据时,发现实际上某个行为已经执行成功了,但日志并未有记录。

2 原因分析及解决

示例代码:

#!/usr/bin/env python
# -*- coding: gbk -*-

import time

fd = open("a.txt", "a")
i = 0
while 1:

    buf = "a\n"
    fd.write(buf)
    time.sleep(1)
    i = i + 1

    if i > 10:
        break

fd.close()

代码的功能很简单,每一秒把“a”写入文件a.txt中。在运行中,发现在运行10秒后,文件a.txt才会真正完成数据的写入。原因是很简单,python的实现中,调用write后,只是把数据写到内核缓冲区,实际上并没有把数据写到磁盘上,只有调用close或是内核缓冲区满的情况下,数据才会写入磁盘中。

我们抽象一下来看,对于我们的服务来说,我们通常会这样写代码:

#!/usr/bin/env python
# -*- coding: gbk -*-

import time

i = 0
while 1:

    # 干活
    do_something()

    # 刷新缓冲区,把数据写到磁盘上,fd为打开的文件句柄,假设你在系统已经打开了
    fd.flush()

对于我们来说,服务每次do_something,我们都希望实时观察到输出。调用flush函数,在每次循环后,都可以把数据输出到磁盘,这样便可实时观察到日志输出。

当然,频繁使用这个函数,要考虑性能问题,系统频繁的将数据写到磁盘,是比较耗CPU的,对于服务访问量不大的情况,这样使用还是比较方便的。

转载于:https://www.cnblogs.com/derrick/p/4067660.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值