requests.request(method,url,**kwargs) merhod7种get、、、
**kwargs:
params:字典或字节序列,作为参数增加到url
data:字典字节序列文件对象作为Request内容
json:json格式作为request内容
headers:字典,头字段
cookies:字典Cookie Jar,Resquest中的cookie
auth:元组,支持认证
files:字典类型传输文件
timeout :设定超时时间单位秒
proxies:字典类型,设定访问代理服务器,可以增加登陆认证
allow_redirects:True/False,默认为True,重定向开关
stream:True/False,默认True,获取内容立即下载开关
verify:认证ssl证书开关
cert:本地ssl证书路径
get(url,params=None,**kwargs) 网页主要内容
head(url,**kwargs) 网页头
post(url,data=None,json=None,**wargs) 提交post 向url位置后新增数据
put(url,data=None,**kwargs) 提交put url位置存储一个数据,覆盖原来的
patch(url,data=None,**kwargs) 修改
delete(url,**kwargs) 删除
HTTP协议
URL格式 http://host[:port][path]
host:主机域名IP地址
port:端口号,缺省端口为80
path:请求资源的路径
小规模Requests库
中规模Scrapy库
Mozilla/5.0是浏览器标识
京东商品
亚马逊商品
百度 360搜索关键词
网络图片爬取
Python split()
通过指定分隔符对字符串进行切片,如果参数 num 有指定值,则分隔 num+1 个子字符串
str.split(str="", num=string.count(str)).
- str -- 分隔符,默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等。
- num -- 分割次数。默认为 -1, 即分隔所有。
with 操作 as 文件:
不需要close文件,自动关闭,减少try异常处理
紧跟with后面的语句被求值后,返回对象的__enter__()方法被调用,这个方法的返回值将被赋值给as后面的变量。当with后面的代码块全部被执行完之后,将调用前面返回对象的__exit__()方法。
ip地址归属自动查询