python爬虫之爬取豆瓣top250图书信息
1. 爬虫库准备
BeautifulSoup
Requests
2. 爬取网页
(1)分析豆瓣图书TOP 250的url:
第一页是https://book.douban.com/top250?start=0
第二页是https://book.douban.com/top250?start=25
第三页是https://book.douban.com/top250?start=50
(2)分析网页源代码中图书信息的所在位置:
3. 代码
import requests from bs4 import BeautifulSoup import time