常见的协议
http和https
http协议:
超文本传输协议,是一个发布和接受HTML页面的方法,端口是80
https 协议:http协议的加密版本,在HTTP下加上了ssl层,端口是443
下面访问的是美团的官网:
可以看到端口是443
URL和RUI
常见的请求方式
http协议规定了浏览器与服务器进行数据交互过程中必须要选择一种交互方式
在http协议中定义了8中请求方式,常见的是get和post请求
get请求: 一般只从服务器获取数据下来,并不会对服务器资源产生任何的影响。
请求的时候关注:
- url
- 请求方式
- 请求头
post请求: 向服务器发送数据(登陆),上传文件等,会对服务器资源产生影响的时候,会使用post请求。
不过有些网站做了反爬虫机制,你去查看信息,也是使用post请求,所以我们写爬虫的时候,一定要分析网站。