Python多线程同步机制:条件变量、事件和屏障
笔记哥 /
03-28 /
15点赞 /
0评论 /
790阅读
# 一文速通 Python 并行计算:04 Python 多线程编程-多线程同步(下)—基于条件变量、事件和屏障

# **摘要:**
本文介绍了 Python 多线程同步的三种机制:条件变量(Condition)、事件(Event)和屏障(Barrier),条件变量指的是线程等待特定条件满足后执行,适用于生产者-消费者模型;Event 指的是线程通过事件标志进行同步,适用于线程间简单通信;Barrier 指的是多个线程需同步到同一阶段时使用,适用于并行任务的分阶段执行。
该文档是一份关于 **并行计算** 和 **Python 并发编程** 的学习指南,内容涵盖了并行计算的基本概念、Python 多线程编程、多进程编程以及协程编程的核心知识点:

# **正文**
# 1.基于条件变量的线程同步
Python 提供的 `Condition` 对象提供了对复杂线程同步问题的支持。`Condition` 被称为条件变量,与互斥锁不同,条件变量是用来等待而不是用来上锁的。**条件变量用来自动阻塞一个线程,直到某特殊情况发生为止。**条件变量是利用线程间共享的全局变量进行同步的一种机制,主要包括两个动作:
- 一个线程等待"条件变量的条件成立"而挂起;
- 另一个线程使 “条件成立”(给出条件成立信号)。
使用 `Condition` 的主要方式为:**线程首先acquire一个条件变量,然后判断一些条件。如果条件不满足则wait;如果条件满足,进行一些处理改变条件后,通过notify方法通知其他线程,其他处于wait状态的线程接到通知后会重新判断条件,**不断的重复这一过程,从而解决复杂的同步问题。
解释条件机制最好的例子还是生产者-消费者问题,在本例中,只要缓存不满,生产者一直向缓存生产;只要缓存不空,消费者一直从缓存取出(之后销毁);当缓冲队列不为空的时候,生产者将通知消费者;当缓冲队列不满的时候,消费者将通知生产者。
```csharp
**i**mport threading
import time
condition = threading.Condition()
products = 0
class Producer(threading.Thread):
def __init__(self):
threading.Thread.__init__(self)
def run(self):
global condition, products
while True:
_# 消费者通过拿到锁来修改共享的资源_
if condition.acquire():
_# 线程首先acquire一个条件变量,然后判断生产是否饱和。_
if products < 10:
_# 如果产品数量小于10,继续生成,并通过notify方法通知消费者_
_# 只要缓存不满,生产者一直向缓存生产;_
products += 1;
print("Producer(%s):deliver one, now products:%s" % (self.name, products))
_# 当缓冲队列不为空的时候,生产者将通知消费者_
condition.notify()
_# 如果已经满了,那么生产者进入等待状态,直到被唤醒_
else:
print("Producer(%s):already 10, stop deliver, now products:%s" % (self.name, products))
condition.wait()
_# 如果队列没有满,就生产1个item,通知状态并释放资源_
condition.release()
time.sleep(2)
class Consumer(threading.Thread):
def __init__(self):
threading.Thread.__init__(self)
def run(self):
global condition, products
while True:
if condition.acquire():
if products > 1:
_# 只要缓存不空,消费者一直从缓存取出(之后销毁)。_
products -= 1
print("Consumer(%s):consume one, now products:%s" % (self.name, products))
_# 当缓冲队列不满的时候,消费者将通知生产者。_
condition.notify()
else:
print("Consumer(%s):only 1, stop consume, products:%s" % (self.name, products))
_# 缓存空,消费者线程等待_
condition.wait()
condition.release()
time.sleep(2)
if __name__ == "__main__":
_# 首先是2个生成者生产products_
for p in range(0, 2):
p = Producer()
p.start()
_# 接下来的10个消费者将会消耗products_
for c in range(0, 10):
c = Consumer()
c.start()
```
运行的结果如下:

乍一看这段代码好像会死锁,因为 `condition.acquire()` 之后就在 `wait()` 了,好像会一直持有锁。其实 `wait()` 会将锁释放,然后等待其他线程 `notify()` 之后会重新尝试获得锁。\*\*但是要注意 **notify()** 并不会自动释放锁,所以代码中有两行,先 **notify()** 然后再 \*\*\*\*release() \*\***。**

实际上,**条件的检测是在互斥锁的保护下进行的。线程在改变条件状态之前必须首先锁住互斥量。**如果一个条件为假,一个线程自动阻塞,并释放等待状态改变的互斥锁。**如果另一个线程改变了条件,它发信号给关联的条件变量,唤醒一个或多个等待它的线程,重新获得互斥锁,重新评价条件。**如果两进程共享可读写的内存,条件变量 可以被用来实现这两进程间的线程同步。
另外:**Condition对象的构造函数可以接受一个Lock/RLock对象作为参数,如果没有指定,则Condition对象会在内部自行创建一个RLock\*\*\*\*;**除了 `notify` 方法外,`Condition` 对象还提供了 `notifyAll` 方法,可以通知 `waiting` 池中的所有线程尝试 `acquire` 内部锁。由于上述机制,处于 `waiting` 状态的线程只能通过 `notify` 方法唤醒,所以 `notifyAll` 的作用在于防止有线程永远处于沉默状态。
**如果不使用条件变量,也可以不断循环检测缓存是否大于 0,但该方法会造成 CPU 资源的浪费。**采用条件变量这一问题就可以迎刃而解!条件变量允许一个线程休眠(阻塞等待)直至获取到另一个线程的通知(收到信号)再去执行自己的操作。


以上消费者-生产者模型过程如下:

以下是另一个有趣的关于条件变量的例子:

原理很简单,就是线程拿到锁先检查是不是自己渴望的状态。比如打印“B”的线程,渴望的状态 `current = 'B'` 然后打印出 B,将状态改成 C ,这样就成了打印“C”的线程渴望的状态。但是这里不能唤醒指定的线程,只好唤醒所有的线程,让他们自己再检查一遍状态了。
# 2.基于事件的线程同步
想象这样一个场景,你启动了多个线程,这些线程都要去访问一个资源,但是,这里有一个小小的问题,即将被访问的资源还没有准备好接受访问,那么此时,多个线程去访问,必然得到不响应,你还得处理这种得不到响应的情况。这样的场景下,能否先在主线程里去做试探,确定资源可以访问以后,再让已经启动了的多线程去访问呢?让我们考虑一下如何用 `Event` 来处理这样的问题。
1. 创建一个 `Event` 对象,现在,事件内部标识是 `False`;
2. 启动多线程,线程里调用 `wait` 方法,这时,会阻塞;
3. 主线程去试探,确定资源可访问以后,调用 `set` 方法,将内置标志设置为 `True`;
4. 该 `Event` 会通知所有等待状态的线程恢复运行:已经调用 `wait` 的线程接手到事件信息,访问资源。
以下为示例代码:
```csharp
import threading
from threading import Event
def worker(event_obj, i):
print('{i}号线程等待事件信号'.format(i=i))
event_obj.wait()
print('{i}号线程收到事件信号'.format(i=i))
event = Event()
for i in range(5):
t = threading.Thread(target=worker, args=(event, i))
t.start()
print('确认资源可用')
event.set()
```
以下为代码输出,可以看到在 `event.set()` 后所有线程恢复运行:

让我们再一次回到生产者-消费者问题上,若要确保如果缓冲区满,生产者不会生成新数据,另外如果缓存区为空,消费者不会查找数据的要求,如何用 `event` 机制实现?代码如下:
```csharp
import time
from threading import Thread, Event
import random
items = []
event = Event()
class consumer(Thread):
def __init__(self, items, event):
_# producer 类初始化时定义了item的list和 Event ,_
_# 与条件对象时候的例子不同,这里的list并不是全局的,而是通过参数传入的_
Thread.__init__(self)
self.items = items
self.event = event
def run(self):
while True:
time.sleep(2)
_# 等待元素到达_
_# 当元素到达时,consumer放弃这个锁_
_# 这就允许其他生产者或消费者进入并获得这个锁_
self.event.wait()
_# 若consumer放弃这个锁被唤醒,它会重新获得锁_
_# 元素到达时,元素从items列表弹出_
item = self.items.pop()
print('Consumer notify : %d popped from list by %s' % (item, self.name))
class producer(Thread):
def __init__(self, items, event):
Thread.__init__(self)
self.items = items
self.event = event
def run(self):
global item
for i in range(100):
time.sleep(2)
item = random.randint(0, 256)
self.items.append(item)
print('Producer notify : item N° %d appended to list by %s' % (item, self.name))
print('Producer notify : event set by %s' % self.name)
_# 添加元素后通知事件_
_# 将内部标识设置为 true 。所有正在等待这个事件的线程将被唤醒。_
_# 当标识为 true 时,调用wait()方法的线程不会被阻塞。_
self.event.set()
print('Produce notify : event cleared by %s '% self.name)
_# 将内部标识设置为 false 。之后调用wait()方法的线程将会被阻塞,_
_# 直到调用set()方法将内部标识再次设置为 true 。_
self.event.clear()
if __name__ == '__main__':
t1 = producer(items, event)
t2 = consumer(items, event)
t1.start()
t2.start()
t1.join()
t2.join()
```

上图是运行程序时候的运行结果,线程 `t1` 在 `list` 最后添加值,然后设置 `event` 来通知消费者。消费者通过 `wait()` 阻塞,直到收到信号的时候从 `list` 中取出元素消费。

补充一下 `wait()` 方法:

# 3.基于屏障的线程同步
屏障用于应对固定数量的线程需要彼此相互等待的情况,与之前介绍 `互斥锁Lock/事件Event/定时器Timer` 等不同,**多线程Barrier会设置一个线程障碍数量parties,如果等待的线程数量没有达到障碍数量 parties,所有线程会处于阻塞状态,当等待的线程到达了这个数量就会唤醒所有的等待线程。**
以播放器为例子:

首先一个线程做播放器初始化工作(加载本地文件或者获取播放地址),然后一个线程获取视频画面,一个线程获取视频声音,只有当初始化工作完毕,视频画面获取完毕,视频声音获取完毕,播放器才会开始播放,其中任意一个线程没有完成,播放器会处于阻塞状态直到三个任务都完成!
```csharp
class threading.Barrier(parties, action=None, timeout=None)
```
创建一个需要 `parties` 个线程的栅栏对象。如果提供了可调用的 `action` 参数,它会在所有线程被释放时在其中一个线程中自动调用。 `timeout` 是默认的超时时间,如果没有在 `wait()` 方法中指定超时时间的话。
使用方法包括:

以下为示例代码,创建三个线程:初始化准备、音频准备、视频准备,当且仅当三个初始化完成,才能启动音乐播放。
```csharp
_# 导入线程模块_
import threading
def plyer_display():
print('初始化通过完成,音视频同步完成,可以开始播放....')
_# 设置3个障碍对象_
barrier = threading.Barrier(3, action=plyer_display, timeout=None)
def player_init(statu):
print(statu)
try:
_# 设置超时时间,如果2秒内,没有达到障碍线程数量,_
_# 会进入断开状态,引发BrokenBarrierError错误_
barrier.wait(2)
except Exception as e:
_# 断开状态,引发BrokenBarrierError错误_
print("等待超时了... ")
else:
print("xxxooooxxxxxooooxxxoooo")
if __name__ == '__main__':
statu_list = ["init ready", "video ready", "audio ready"]
thread_list = list()
_# 创建三个线程:初始化准备、音频准备、视频准备_
_# 当且仅当三个初始化完成,才能启动音乐播放_
for i in range(0, 3):
t = threading.Thread(target=player_init, args=(statu_list[i],))
t.start()
thread_list.append(t)
for t in thread_list:
t.join()
```
以下为代码运行结果,注意:如果 `barrier.wait(timeout=None)` 等待超时,会进入断开状态,引发 `BrokenBarrierError` 错误,为了程序的健壮性,最好加上异常处理。

本文来自投稿,不代表本站立场,如若转载,请注明出处:http//www.knowhub.vip/share/2/1775
- 热门的技术博文分享
- 1 . ESP实现Web服务器
- 2 . 从零到一:打造高效的金仓社区 API 集成到 MCP 服务方案
- 3 . 使用C#构建一个同时问多个LLM并总结的小工具
- 4 . .NET 原生驾驭 AI 新基建实战系列Milvus ── 大规模 AI 应用的向量数据库首选
- 5 . 在Avalonia/C#中使用依赖注入过程记录
- 6 . [设计模式/Java] 设计模式之工厂方法模式
- 7 . 5. RabbitMQ 消息队列中 Exchanges(交换机) 的详细说明
- 8 . SQL 中的各种连接 JOIN 的区别总结!
- 9 . JavaScript 中防抖和节流的多种实现方式及应用场景
- 10 . SaltStack 远程命令执行中文乱码问题
- 11 . 推荐10个 DeepSeek 神级提示词,建议搜藏起来使用
- 12 . C#基础:枚举、数组、类型、函数等解析
- 13 . VMware平台的Ubuntu部署完全分布式Hadoop环境
- 14 . C# 多项目打包时如何将项目引用转为包依赖
- 15 . Chrome 135 版本开发者工具(DevTools)更新内容
- 16 . 从零创建npm依赖,只需执行一条命令
- 17 . 关于 Newtonsoft.Json 和 System.Text.Json 混用导致的的序列化不识别的问题
- 18 . 大模型微调实战之训练数据集准备的艺术与科学
- 19 . Windows快速安装MongoDB之Mongo实战
- 20 . 探索 C# 14 新功能:实用特性为编程带来便利