- 博客(5)
- 收藏
- 关注
原创 Python爬虫基础数据提取方法之json
json1.数据交换格式,看起来像Python类型(列表,字典)的字符串2.使用json之前需要导入3.json.loads把json字符串转化为python类型json.loads(json字符串)4.json.dumps把python类型转化为json字符串类型json.dumps({})json.dumps(ret1,ensure_ascii=False.indent=2)...
2020-05-06 09:01:29
668
原创 Python format格式化函数及括号的区别
它通过{}和:来代替传统%方式1.使用位置参数要点:从以下例子可以看出位置参数不受顺序约束,且可以为{},只要format里有相对应的参数值即可,参数索引从0开,传入位置参数列表可用*列表>>>"My name is{},age{}".format("toto",20)My name is toto,age 20>>>"My name i...
2020-05-04 21:17:22
1189
原创 Python爬虫基础(二)处理cookies相关请求
接着上回说的requests相关知识进行补充使用超时参数requests.get(url,headers=headers,timeout=3) 3秒内必须返回,否则会报错retrying模块学习1.安装 pip install retrying2.举例内联代码片。import requestsfrom retrying import retrydef _par...
2020-04-30 18:03:08
337
原创 Python爬虫基础(一)requests学习
requests安装电脑搜索栏输入cmd进入命令提示符填入 pip install requests 安装完成调用import requests发送get,post请求1.response=requests.get(url) 发送get请求,url地址才能响应2.response=requests.post(url,data={请求体的字典}) 发送post请求re...
2020-04-29 20:05:08
187
原创 Python爬虫基础 了解HTTP,HTTPS知识
HTTP:超文本传输协议(http,hypertext transfer protocol)是互联网上应用最为广泛的一种网络协议1.以明文的形式传输(不安全)2.效率更高HTTPS:HTTP+SSL这里的SSL是指安全套接字层1.传输之前数据先加密,之后解密才能获取内容2.效率比较低,安全可靠性较高HTTP协议的请求1.请求行2.请求头。User-Agent:用户代理:对方服务...
2020-04-29 19:20:47
189
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅