python线程同步

转自:http://www.cnblogs.com/tqsummer/archive/2011/01/25/1944771.html

假设两个线程对象t1和t2都要对num=0进行增1运算,t1和t2都各对num修改10次,num的最终的结果应该为20。但是由于是多线程访问,有可能出现下面情况:在num=0时,t1取得num=0。系统此时把t1调度为”sleeping”状态,把t2转换为”running”状态,t2页获得num=0。然后t2对得到的值进行加1并赋给num,使得num=1。然后系统又把t2调度为”sleeping”,把t1转为”running”。线程t1又把它之前得到的0加1后赋值给num。这样,明明t1和t2都完成了1次加1工作,但结果仍然是num=1。

  上面的case描述了多线程情况下最常见的问题之一:数据共享。当多个线程都要去修改某一个共享数据的时候,我们需要对数据访问进行同步。

1、  简单的同步

最简单的同步机制就是“锁”。锁对象由threading.RLock类创建。线程可以使用锁的acquire()方法获得锁,这样锁就进入“locked”状态。每次只有一个线程可以获得锁。如果当另一个线程试图获得这个锁的时候,就会被系统变为“blocked”状态,直到那个拥有锁的线程调用锁的release()方法来释放锁,这样锁就会进入“unlocked”状态。“blocked”状态的线程就会收到一个通知,并有权利获得锁。如果多个线程处于“blocked”状态,所有线程都会先解除“blocked”状态,然后系统选择一个线程来获得锁,其他的线程继续沉默(“blocked”)。

Python中的thread模块和Lock对象是Python提供的低级线程控制工具,使用起来非常简单。如下例所示:

import thread  
import time  
mylock = thread.allocate_lock()  #Allocate a lock  
num=0  #Shared resource  
  
def add_num(name):  
    global num  
    while True:  
        mylock.acquire() #Get the lock   
        # Do something to the shared resource  
        print 'Thread %s locked! num=%s'%(name,str(num))  
        if num >= 5:  
            print 'Thread %s released! num=%s'%(name,str(num))  
            mylock.release()  
            thread.exit_thread()  
        num+=1  
        print 'Thread %s released! num=%s'%(name,str(num))  
        mylock.release()  #Release the lock.  
  
def test():  
    thread.start_new_thread(add_num, ('A',))  
    thread.start_new_thread(add_num, ('B',))  
  
if __name__== '__main__':  
    test()  

Python thread的基础上还提供了一个高级的线程控制库,就是之前提到过的threadingPythonthreading module是在建立在thread module基础之上的一个module,在threading module中,暴露了许多thread module中的属性。在thread module中,python提供了用户级的线程同步工具“Lock”对象。而在threading module中,python又提供了Lock对象的变种: RLock对象。RLock对象内部维护着一个Lock对象,它是一种可重入的对象。对于Lock对象而言,如果一个线程连续两次进行acquire操作,那么由于第一次acquire之后没有release,第二次acquire将挂起线程。这会导致Lock对象永远不会release,使得线程死锁。RLock对象允许一个线程多次对其进行acquire操作,因为在其内部通过一个counter变量维护着线程acquire的次数。而且每一次的acquire操作必须有一个release操作与之对应,在所有的release操作完成之后,别的线程才能申请该RLock对象。下面来看看如何使用threading的RLock对象实现同步。

下面来看看如何使用threadingRLock对象实现同步。

import threading  
mylock = threading.RLock()  
num=0  
   
class myThread(threading.Thread):  
    def __init__(self, name):  
        threading.Thread.__init__(self)  
        self.t_name = name  
          
    def run(self):  
        global num  
        while True:  
            mylock.acquire()  
            print '\nThread(%s) locked, Number: %d'%(self.t_name, num)  
            if num>=4:  
                mylock.release()  
                print '\nThread(%s) released, Number: %d'%(self.t_name, num)  
                break  
            num+=1  
            print '\nThread(%s) released, Number: %d'%(self.t_name, num)  
            mylock.release()  
              
def test():  
    thread1 = myThread('A')  
    thread2 = myThread('B')  
    thread1.start()  
    thread2.start()  
   
if __name__== '__main__':  
    test()  
我们把修改共享数据的代码成为“临界区”。必须将所有“临界区”都封闭在同一个锁对象的acquirerelease之间。



### Python 线程同步方法及其实现 #### Lock 锁机制 `Lock` 是最简单的锁对象。当一个线程获取到这个锁之后,其他试图获取该锁的线程将会被阻塞直到第一个线程释放此锁。 ```python import threading lock = threading.Lock() def thread_safe_operation(): lock.acquire() try: # Critical section of code here pass finally: lock.release() ``` 这种方法可以防止多个线程同时进入临界区从而引发数据竞争条件[^1]。 #### RLock 可重入锁 `RLock` 对象允许同一线程多次获得它而不会死锁。这意味着同一个线程可以在已经持有锁的情况下再次请求相同的锁而不必等待自己先释放掉之前的锁实例。 ```python rlock = threading.RLock() def reentrant_function(): with rlock: # Some operations that may call other functions also using this same lock another_reentrant_call() def another_reentrant_call(): with rlock: # More critical sections... pass ``` 这种方式适用于那些可能调用同样需要锁定资源函数的情况。 #### Condition 条件变量 `Condition` 结合了 `Lock` 和通知功能于一体。它可以用来协调多个线程之间的执行顺序,即让某些特定条件下才继续往下走。 ```python condition = threading.Condition() def consumer(): with condition: while not available(): # 假设有一个available()判断是否有可用的数据 condition.wait() # 如果没有就挂起当前线程并释放锁 consume_data() # 当收到信号后恢复执行 def producer(): produce_data() with condition: condition.notify_all() # 生产者完成生产则唤醒所有消费者 ``` 这有助于构建更复杂的协作模式比如生产者-消费者模型[^2]。 #### Semaphore 计数器信号量 `Semaphore` 控制着最多能有多少个线程能够访问共享资源。通过设定初始计数值来限制并发度。 ```python semaphore = threading.Semaphore(3) def limited_access_resource(): semaphore.acquire() try: use_shared_resource() finally: semaphore.release() ``` 这里设置的最大并发数量为3,超过三个线程尝试获取时会被暂时搁置直至有空位为止。 #### Event 事件标志 `Event` 提供了一种简单的方式用于在线程之间传递状态信息。“set” 方法会将内部标记变为True,“clear” 则将其变回False;“wait” 将一直等到内部标记变成 True 才返回。 ```python event = threading.Event() def waiter(): event.wait() do_something_after_event_set() # Another place sets the event when some condition is met. if ready_to_proceed: event.set() ``` 这种机制非常适合于触发动作或作为屏障使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值