java/python学习的第十六天/python爬虫

1.http的端口号为80,https的端口号为443,所以访问http://14.215.177.38:80和https://14.215.177.38:443
2.http请求和响应

在这里插入图片描述

在这里插入图片描述
2.爬虫
1.数据采集程序
爬取的数据来源于网络,网络中的数据可以是由Web服务器(Nginx/Apache) 、数据库服务器(MySQL、Redis)、索引库(ElastichSearch) 、大数据(Hbase/Hive)、视频/图片库(FTP)、云存储等(OSS)提供的。
在这里插入图片描述
2.使用python的爬虫可以定时定量的完成数据爬取,可以完成多种测试,例如接口测试,性能测试,功能测试等等
3.在这里插入图片描述
其实爬虫就是伪造一个浏览器请求的数据的
爬虫的三个步骤:
1.爬取网页
2.解析数据
3.保存数据
代码:用于爬取数据
获取get请求
import urllib.request
response =urllib.request.urlopen(“https://www.datafountain.cn/”)
print(response.read().decode(‘utf-8’))

获取post请求
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值