1.文字保存成文档
h_list=etree.HTML(page_text)
div_list=h_list.xpath('//section[@class="list"]/div')
fp=open('5.txt','w',encoding='utf-8')
for div in div_list:
title=div.xpath('./a/div[2]/div/div/h3/text()')[0]
fp.write(title+'\n')
2. 图片保存到文件夹
# 如果不存在piclibs文件夹,那就新建一个文件夹
if not os.path.exists('./Libs'):
os.mkdir('./Libs')
# 存储 图片content 是二进制形式 img_data=requests.get(url=img_src,headers=headers).content # 图片名 img_path = 'Libs/'+img_name with open(img_path,'wb')as fp: fp.write(img_data) print(img_name,'下载成功!')
2385

被折叠的 条评论
为什么被折叠?



