python-3-进程和线程

本文介绍了Python中的多进程编程,包括使用multiprocessing模块创建多进程的方法和利用进程池处理多任务的技术。通过具体实例展示了如何管理和控制子进程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一. 多进程

    Python实现多进程的方式主要有两种,一种方法是使用os模块中的fork(方法,另一种
方法是使用multiprocessing模块。这两种方法的区别在于前者仅适用于Unix/Linux操作系统,
对Windows不支持,后者则是跨平台的实现方式。由于现在很多爬虫程序都是运行在
Unix/Linux操作系统上,所以本节对两种方式都进行讲解。

1.使用multiprocessing模块创建多进程

import os
from multiprocessing import Process

def run_proc(name):
    print('Child process %s (%s) Running...'%(name,os.getpid()))

if __name__ == '__main__':
    print('Parent process %s.' % os.getpid())
    for i in range(5):
        p = Process(target=run_proc,args=(str(i),))
        print('Process will start.')
        p.start()
    p.join()
    print('Process end.')


2. 使用进程池处理多进程


import os,time,random
from multiprocessing import Pool

def run_proc(name):
    print('Task %s (pid=%s) Running...'%(name,os.getpid()))
    time.sleep(random.random()*3)
    print('Task %s end.' % name)

if __name__ == '__main__':
    print('Current process %s.' % os.getpid())
    p = Pool(processes=30)
    for i in range(100):
        p.apply_async(run_proc,args=(i,))
    print('Waiting for all subporcesses done....')
    p.close()
    p.join()
    print('All subporcesses done.')





二. 多线程


三. 协程


四. 分布式进程


### Python进程线程的概念 #### 进程 (Process) 进程是指操作系统结构中的基本单元,拥有独立的地址空间。每个进程都有自己私有的数据段、堆栈区全局变量等资源,在创建进程时会复制父进程的数据副本[^3]。 - **优点** - 更高的稳定性:由于各进程间相互隔离,一个进程崩溃不会影响其他进程- **缺点** - 创建销毁成本高:因为涉及内存分配等问题,所以开销较大。 - 数据共享困难:不同进程之间传递消息较为复杂。 ```python from multiprocessing import Process, Queue def f(q): q.put([42, None, 'hello']) if __name__ == '__main__': queue = Queue() p = Process(target=f, args=(queue,)) p.start() print(queue.get()) # prints "[42, None, 'hello']" p.join() ``` #### 线程 (Thread) 线程进程中可调度运行的一个实体;同一进程下的多个线程共享该进程的所有资源,包括代码段、数据段等,但每个线程有自己的调用栈[^1]。 - **优点** - 启动速度快:相比于进程来说更轻量级。 - 资源消耗少:不需要像启动新进程那样占用大量系统资源。 - **缺点** - 容易受到GIL(Global Interpreter Lock)的影响,在CPU密集型任务上表现不佳。 - 如果某个线程发生异常,则可能会影响到整个程序的安全性可靠性。 ```python import threading class MyThread(threading.Thread): def run(self): print(f"{threading.current_thread().getName()} started") threads = [] for i in range(5): t = MyThread() threads.append(t) t.start() for thread in threads: thread.join() print("All threads finished execution.") ``` ### 应用场景分析 对于I/O 密集型操作(如文件读写、网络请求),推荐使用多线程来处理,这样可以在等待期间让出 CPU 给其他线程继续工作,从而提高整体性能。 而对于计算密集型的任务(比如大规模数据分析或图像渲染),则更适合采用多进程方案,以充分利用多核处理器的优势并绕过 GIL 的限制。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值