本次小实验的目的爬取4k壁纸网站的壁纸,但以为实力有限所以只能爬取网站样图,本次爬取的数据仅供学习使用。
网站样式:
代码部分:
import requests
import os
import time
from lxml import etree
if __name__ == "__main__":
url = 'http://pic.netbian.com/'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36'
}
print('———————————————————搜索壁纸类型中————————————————————')
print('——————————————————共搜索到以下类型壁纸——————————————————')
#------(1)-------------首先对首页请求 ,返回所有的壁纸类型------------
r1 = requests.get(url =url ,headers =headers)
r1.encoding = r1.apparent_encoding
r1_html = r1.text
tree1 = etree.HTML(r1_html)
kind = tree1.xpath('//div[@class="classify clearfix"]/a/text()')
a=1
#------(2)------------打印搜索到的所有类型------------------------
for k in kind:
print(str(a)+':'+str(k))
a=a+1
b = input('选择需要下载的类型(输入对应的序号):')
#获取连接的后缀用于拼接
<