新手,初级尝试。爬取简单网站的MM照片。写博留念。
步骤如下:
第一步:分析网站
网址:http://www.7160.com/xingganmeinv/list_3_1.html
打开网页元素,找到图片地址位置,地址在img标签下的src键中,获取每张照片的地址(http://img.7160.com/uploads/180130/12-1P1301A92Bc.jpg)然后用二进制格式保存照片。
第二步:获取页面代码
1.导入库:
#!/usr/bin/python # -*- coding:utf-8 -*- import urllib2 from bs4 import BeautifulSoup

本文记录了一位新手初次尝试爬虫的过程,目标是获取简单网站上的美女照片。步骤包括分析网站、获取页面代码、解析图片地址及保存图片。在获取页面代码时,通过设置re_tries参数处理HTTP错误,最终成功实现图片抓取。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



