不识有话说
作为一个爬虫萌新,第一个小项目当然是爬一爬我们的萌新之友-《新笔趣阁》
虽然没什么难度,
不过还是分享一下自己的代码历程,
希望能给予大家一些思路或帮助,
当然,如果有大佬能够指出错误或可以改进的地方,
那当然更好了,
等你呦~
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
项目展示
在讲解项目之前,
先给你们展示一下功能,
不然看了半天,
结果不是自己想要的那不是自闭了。
<----------------------------------分割线------------------------------------->



说实话,感觉我挺憨的才能写出这种代码,谁下载小说不是一整本一整本下,
结果也就我傻大憨的一章一章下,甚至还觉得自己好牛,害
代码思路讲解
项目要用到的模块
import os from time import sleep import requests from lxml import etree 1234
没有的话可以自行安装,虽然大部分小伙伴应该都知道,但还是说一下
pip/pip3 install 想要安装的模块名 1
模块安装好了接下来讲解代码了
import os
from time import sleep
import requests
from lxml import etree
# 新笔趣阁的全部小说界面链接,所有小说链接都在这里
url = 'http://www.xbiquge.la/xiaoshuodaquan/'
# 请求头
headers = {
'User-Agent':"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36"
}
# 向新笔趣阁发送get请求
all_book_r = requests.get(url, headers=he

这篇博客是Python爬虫新手入门教程,作者分享了如何爬取笔趣阁小说的详细过程,包括代码思路、模块安装、XPath使用方法,以及完整代码示例。旨在帮助初学者理解爬虫基本操作,并欢迎读者提出建议和改进。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



