- 博客(3)
- 收藏
- 关注
原创 使用python lxml库中的xpath、etree爬取网页超链接
python版本:3.7.3 lxml版本:4.3.3 (pip install lxml 的时候也出现了错误,最后是用 pip3 install lxml==4.3.3才下载完成的,但是感觉这俩也没有多大区别…) 因为版本原因,直接使用 from lxml import etree 导入是不可以的,所以我采用了如下:import lxml.html etree = lxml.html.etree 最后把爬取的超链接循环打印了出来 import requests import chardet import
2021-04-16 21:54:17
3778
原创 爬取网页所有.jpg文件图片的简单代码的模板
#爬取网页所有.jpg文件图片的简单代码的模板 ##只是爬虫小白,还请各位前辈们指导 #导入requests与re库 import requests import re #需要爬取工作的网站,这里看自己找什么网页了,例如豆瓣,淘宝,图片库等等,只需粘贴复制即可。(加密除外) url = "" page = requests.get(url).text #r'src="(http.+?.jpg)"' res = re.compile(r'src="(http.+?.jpg)"') reg = re.fin
2021-04-12 22:22:00
609
2
原创 Python列表排序
利用append,sort(),制作商品购物车价格排序小程序。 price = [399,4555,12456,4022,15200,4441,4411,52,36978,10000000] list = [] max_section = int(input("请输入最大价格:")) mid_section = int(input("请输入最小价格:")) for i in price: if mid_section <= i <= max_section: list.a
2020-11-17 17:15:30
616
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人