本篇博客是《爬虫120例》的复盘案例更新,原文为《技术圈的【多肉小达人】,一篇文章你就能做到》,案例出了一点小小问题,网站没了,很尴尬
此时就需要我们的爬虫训练场出马了,谁叫咱的口号是让天下没有失效的爬虫
呢!
在正式编写本案例前,我还是找到了一个目标站点,即使用自建站,一些基础数据还是要提前采集一下的
www.huabaike.com/drzw/
采集目标站点
我们建设爬虫训练场,仅需要名称和图片即可,详情不在本次的采集范围内,并且数据量不多,仅使用 requests + re 模块即可,正好,和