第六讲 多线程爬虫
关注:程序运行速度-->CPU(大脑)
--提高程序运行速度-->提高cpu利用率。
提高cpu利用率-->1,让cpu不休息-->cpu每时每刻都在处理任务--线程--》2,cpu都是分核-->每个核都是一个小cpu-->一心多用-->让每个核都作用起来,做不同事情-->多进程
一、程序、线程、进程?
程序–>一应用一程序
进程–>程序运行资源分配最小单位–>一程序可有多个进程
线程–>cpu最小的调度单位,依赖进程存在。线程无独立资源–>所有的线程可共享他所在进程的所有资源
二、什么是多线程–》程序包含多个并行的线程来完成不同任务
三、python中的threding模块
1、创建多线程的第一种方法:
t=threding.Thred(
target=方法名,
args=(,)–参数列表,元组
)
t.start()–启动线程
2、查看线程的数量:threading.enumerate()
可迭代对象
i,–表示索引从i开始)–python的内置函数:枚举可迭代对象,同时获取迭代对象的每个值和其索引。
可迭代对象–>有__iter__属性的对象。
迭代器–>有__iter__和__next__属性的对象。
如何转化:迭代器=iter(可迭代对象)
可迭代对象都有-->list,tuple,dict,str,bytesarray,set,fp(文件流)
3、创建第二种方法:自定线程类
python的继承-->1,继承是通过在定义类的时候,类后面的()中添加父类来实现的。-->2,被继承的类称为父类&#x