一、多线程功能与库
1.多线程功能
一个线程、一个进程,称为单线程爬虫,单线程爬虫每次只能访问一个页面。
多线程爬虫可以同时访问10个页面,或者更多,相当于爬取速度提高了10倍。
2.多进程库
多进程库:multiprocessing
multiprocessing的dummy模块,可以让python使用multiprocessing。
Dummy下面有一个Pool类,用来实现多线程。
from multiprocessing import Pool
pool=Pool(processes=4) #创建进程池
pool.(func,i