提示:爬虫步骤很机械,方法很多样,请多多练习…
前言
本次爬虫也是为了完成作业,这也是一个连反爬虫都没设置的基础级网站,所以没啥特殊的,唯一的问题是笔者的comments字段出现缺失与乱序现象,如何进行定位呢?(笔者在前面爬取电影那一章
已经解决了该问题,但是在CSS里面又该如何轻松处理呢…这个问题有待探讨,有思路的小伙伴也可以私信我一起交流,小白入坑)
一、导入所需要的模块
import requests
from bs4 import BeautifulSoup
import time
二、创建爬虫类,主