1、任选一小说网站,爬取任意一部小说,以记事本的形式保存。
第一种情况(网址可能已失效):
import requests
from lxml import etree
def get_url():
url = 'http://www.yuetutu.com/cbook_24378/'
r = requests.get(url)
tree = etree.HTML(r.text)
return tree
def get_book_url(tree):
book_list= []
dd_list = tree.xpath('//*[@id="list"]/dl/dd')
i = 1
for dd in dd_list:
if i >= 9:
url_book = dd.xpath('a')[0].attrib['href']
title_book = dd.xpath('a')[0].text
book_list.append((title_book<

本文介绍了一种使用Python的requests库和lxml库抓取网络小说的方法,通过解析网页结构,获取小说章节链接和内容,并保存为本地文件。
最低0.47元/天 解锁文章
1106

被折叠的 条评论
为什么被折叠?



