一、爬取流程介绍
首先看一下我们需要爬取的飞卢小说网的免费小说《全民:开局邀请光头强挑战只狼》网址,如下图所示:

点击第一章,按F12键打开浏览器开发者工具,再点击开发者工具左上角的小箭头,找到小说内容在网页中所在的位置,如下图所示:

可以看到,在具体的章节中,小说内容均在一个class="noveContent readline"的标签下,先构造一个函数,用于获取章节页的小说文本内容,使用的是BeautifulSoup库提取数据,再用正则表达式替换掉不需要的内容,代码如下:
def get_content