python爬虫
文章平均质量分 85
hp20170614
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
request+xpath爬取多个网页信息并保存到本地
文章目录前言一、第一步:分析网页二、遇到的问题1.一个网站里有很多网页,一个网页里有很多篇文章,怎么提取文章信息2.xpath解析的链接不完整三、代码 前言 最近在学习python爬虫,实践是最好的学习方法。想爬取一个网页的信息保存到excel表中,从网上找了很多代码,要么不符合要求,要么总是有错误。 自己看了很多优快云的代码,终于达到了自己想要的效果。这篇文章就把学习中遇到的坑记录一下,并把代码分享给大家。 一、第一步:分析网页 首先要有一些前端基础,能看懂HTML,CSS语句。其次需要了解要爬.原创 2021-05-18 19:11:03 · 1815 阅读 · 0 评论 -
BeautifulSoup爬取多个网页的图片并保存到本地文件夹
文章目录前言一、利用BeautifulSoup爬取图片二、遇到的问题1.提取的图片链接总是报错:ValueError:invalid literal for int() with base 10: 'image'2.怎么过滤掉目标网页中不需要的图片链接三、代码和结果截图 前言 这篇文章是提取网页里的图片,是上一篇提取文本的下文。 提示:以下是本篇文章正文内容,下面案例可供参考 一、利用BeautifulSoup爬取图片 BeautifulSoup 是 python 的一个库,最主要的功能是从网页抓取数.原创 2021-05-18 20:44:14 · 1453 阅读 · 0 评论
分享