爬虫练习:爬豆瓣读书的短评
利用第三方库requests爬取网页内容,然后利用BeautifulSoup解析网页内容,得到我们想要的数据。
任务1:爬豆瓣读书《下町火箭》的短评。
利用requests库可以爬下《下町火箭》短评的网页内容:
import requests
r = requests.get('https://book.douban.com/subject/34449306/comments/')
r.status_code
Out[3]: 200
r.text
Out[4]: '\n\n<!DOCTYPE html>\n<html lang="zh-cmn-Hans" class=" book-new-nav">\