
python
sdu@xy
山东大学
展开
-
python 按省份输出中国大学排名
import requestsfrom bs4 import BeautifulSoupimport bs4 def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return "" .原创 2020-06-16 20:46:19 · 4734 阅读 · 2 评论 -
python 爬虫爬取中国最好大学排名
from bs4 import BeautifulSoupimport requestsallUnivList = []def getHTMLText(url): try: r = requests.get(url) r.raise_for_status() r.encoding = 'utf-8' return r.text except: return " "def findUnivList(so.原创 2020-06-01 12:51:42 · 644 阅读 · 0 评论 -
python Image库 压缩图片至指定大小
from PIL import Imageimport ospath="test.jpg"im=Image.open(path)#返回一个Image对象#os模块中的path目录下的getSize()方法获取文件大小,单位字节Bytesize=os.path.getsize(path)/1024 #计算图片大小即KBprint(size)#size的两个参数width,height=im.size[0],im.size[1]#用于保存压缩过程中的temp路径,每次压缩会被不断覆盖ne.原创 2020-05-11 19:42:31 · 4122 阅读 · 1 评论 -
python 爬虫 robots协议
Requests库:小规模,数据量小,爬取速度不敏感。Scrapy:中规模,数据量较大,爬取速度敏感定制开发(Google/Firefox):大规模,搜索引擎,爬取全网,爬取速度关键Robots:Robots Exclusion Standard 网络爬虫排除标准,网站告知爬虫哪些页面可以爬取 形式:在网站根目录下的robots.txteg:http://www.jd.com/ro...原创 2020-04-29 19:54:09 · 289 阅读 · 0 评论 -
requests.request(method,url,**kwargs) 13个参数详解
requests.request(method,url,**kwargs)**kwargs:控制访问的参数,均为可选项params:字典或字节序列,作为参数添加到URL中kv={'k1':'v1','k2':'v2'}r=requests.request('GET',url,params=kv)#添加到URL中print(r.url)#http://www.baidu.com/?...原创 2020-04-29 19:32:21 · 6486 阅读 · 0 评论 -
python Requests库详解
一:requests库下载安装fle->setttings->Project:pythonPro->python interpreter->点击+号->输入requests->点击install package 安装完成二:requests中的方法request()(下面六个方法都是调用该方法实现)get():获取URL全...原创 2020-04-29 16:41:37 · 629 阅读 · 0 评论