【python】多线程之坑

由于性能需要。加上没有使用集群,因此在代码中使用了多线程,但是由于python中全局解释锁GIL的存在造成使用多线程的时候并不能起到作用,在使用threadpool时,设置线程数并不能起到作用。

因此应该使用多进程才是正确的,使用multiprocessing库可以使用多进程的方式使用之。不过使用的时候要确保能异步执行的,先将数据分成n份,然后将线程再分成n个,每个线程执行一份数据,最后将结果合并。

如下所示:

#数据文件为hu_data
hu_data=func(...)
hu_all = list()
hu_len = len(hu_data)
    t = 8
    #切分数据
    for x in range(t):
        hu_all.append(hu_data[round(hu_len*x/t):round(hu_len*(x+1)/t)])
    #启动进程
    pool = multiprocessing.Pool(processes=t)
    result = list()
    for i in hu_all:
        result.append(pool.apply_async(func, (i,)))
    pool.close()
    pool.join()
#拼接结果
re = list()
for i in result:
        for k in i.get():
            re.append(k)
            

 

PS:粗俗的将同步是指当前所做的事情过度依赖前面的事情,如果前面的事情没有做好,那么当前会处于阻塞状态;而异步是指当前所做的事情并不依赖前面的事情,因此不会引起阻塞。

当涉及到多线程编程时,确实存在一些点。以下是几个常见的 Python 多线程: 1. 全局解释器锁(GIL):在 Python 中,由于 GIL 的存在,一个线程只能在一个时间点上执行 Python 代码。这意味着即使你有多个线程,你的代码也无法并行执行。因此,如果你想要充分利用多核 CPU,你需要使用多个进程而不是多个线程。 2. 竞争条件:多个线程同时访问共享资源可能会导致竞争条件。例如,如果两个线程同时尝试向同一个文件写入数据,可能会导致数据损坏或丢失。为了避免这种情况,你需要使用锁或其他同步原语来确保每个线程访问资源的顺序。 3. 内存泄漏:多线程应用程序中的内存泄漏可能比单线程程序更难以跟踪和调试。因为多个线程可以同时访问相同的内存地址,所以即使一个线程已经释放了一块内存,其他线程仍然可以访问它。为了避免这种情况,你需要确保在不再需要内存时正确地释放它。 4. 连接池的:当使用连接池时,你需要小心不要在多个线程之间共享连接。如果你的应用程序使用了多个线程,并且每个线程都尝试从连接池中获取连接,则可能会出现竞争条件。为了避免这种情况,你需要为每个线程使用独立的连接池。 总之,在使用 Python 进行多线程编程时,你需要小心处理这些点,并且确保你的应用程序在多线程环境下稳定和可靠。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一杯拿铁go

你的打赏是我更新最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值