抓取起点网站的所有小说(未分类抓取),并将提取的数据保存到本地csv文件中。
采用requests抓取网页,用BeautifulSoup解析网页,用select方法提取元素(也可以使用find()方法)
import requests
import csv
from bs4 import BeautifulSoup
import time#设置抓取间隔时间
page_urls=[]#页数链接
book_urls=[]#每页中的小说链接
url='http://a.qidian.com/'
def get_url(url):#获取页数链接
headers={
'User-Agent':"Mozilla/5.