Python爬虫新手入门第一节，爬取笔趣阁小说！

Python爬虫初学者教程：爬取笔趣阁小说

最新推荐文章于 2024-06-24 18:45:00 发布

原创

最新推荐文章于 2024-06-24 18:45:00 发布 · 533 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #人工智能 #selenium #xpath

这篇博客是Python爬虫新手入门教程，作者分享了如何爬取笔趣阁小说的详细过程，包括代码思路、模块安装、XPath使用方法，以及完整代码示例。旨在帮助初学者理解爬虫基本操作，并欢迎读者提出建议和改进。

不识有话说

作为一个爬虫萌新，第一个小项目当然是爬一爬我们的萌新之友-《新笔趣阁》
虽然没什么难度，
不过还是分享一下自己的代码历程，
希望能给予大家一些思路或帮助，
当然，如果有大佬能够指出错误或可以改进的地方，
那当然更好了，
等你呦~

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

项目展示

在讲解项目之前，
先给你们展示一下功能，
不然看了半天，
结果不是自己想要的那不是自闭了。
<----------------------------------分割线------------------------------------->

说实话，感觉我挺憨的才能写出这种代码，谁下载小说不是一整本一整本下，
结果也就我傻大憨的一章一章下，甚至还觉得自己好牛，害

代码思路讲解

项目要用到的模块

import os
from time import sleep
import requests
from lxml import etree
1234

没有的话可以自行安装，虽然大部分小伙伴应该都知道，但还是说一下

pip/pip3 install 想要安装的模块名
1

模块安装好了接下来讲解代码了

import os
from time import sleep

import requests
from lxml import etree

# 新笔趣阁的全部小说界面链接，所有小说链接都在这里
url = 'http://www.xbiquge.la/xiaoshuodaquan/'
# 请求头
headers = {
    'User-Agent':"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36"
}
# 向新笔趣阁发送get请求
all_book_r = requests.get(url, headers=he