
python爬虫学习
小森豆丁
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
爬虫实战——xpath爬取电影天堂
from lxml import etreeimport requestsHEADERS = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36'}BASE_DOMA...原创 2020-04-14 13:27:49 · 786 阅读 · 0 评论 -
爬虫实战——古诗文网古诗爬取
import reimport requests# url = 'https://www.gushiwen.org/default_1.aspx'def parse_page(url): headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 ...原创 2020-04-14 13:22:42 · 1416 阅读 · 0 评论 -
爬虫实战——糗事百科段子爬取
import reimport requests# import osheaders = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.92 Safari/537.36'}def parse...原创 2020-04-14 13:16:26 · 220 阅读 · 0 评论