第六讲 多线程爬虫

本文详细介绍了多线程的概念,包括程序、线程、进程的区别,如何在Python中使用`threading`模块创建线程,以及线程的状态、线程间数据共享的问题和并发与并行的区别。通过实例展示了如何避免线程安全问题,并强调了多线程在爬虫中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第六讲 多线程爬虫

关注:程序运行速度-->CPU(大脑)
--提高程序运行速度-->提高cpu利用率。

提高cpu利用率-->1,让cpu不休息-->cpu每时每刻都在处理任务--线程--》2,cpu都是分核-->每个核都是一个小cpu-->一心多用-->让每个核都作用起来,做不同事情-->多进程	

一、程序、线程、进程?
程序–>一应用一程序
进程–>程序运行资源分配最小单位–>一程序可有多个进程
线程–>cpu最小的调度单位,依赖进程存在。线程无独立资源–>所有的线程可共享他所在进程的所有资源

二、什么是多线程–》程序包含多个并行的线程来完成不同任务
三、python中的threding模块
1、创建多线程的第一种方法:
t=threding.Thred(
target=方法名,
args=(,)–参数列表,元组
)
t.start()–启动线程
2、查看线程的数量:threading.enumerate()
可迭代对象
i,–表示索引从i开始)–python的内置函数:枚举可迭代对象,同时获取迭代对象的每个值和其索引。
可迭代对象–>有__iter__属性的对象。
迭代器–>有__iter__和__next__属性的对象。

	如何转化:迭代器=iter(可迭代对象)
	可迭代对象都有-->list,tuple,dict,str,bytesarray,set,fp(文件流)
3、创建第二种方法:自定线程类
    python的继承-->1,继承是通过在定义类的时候,类后面的()中添加父类来实现的。-->2,被继承的类称为父类&#x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值