Cookie
参考:https://zh.wikipedia.org/wiki/Cookie
介绍
Cookie(负数Cookies),中文名“小型文本文件”,或者“小甜饼”,指某些网站为辨别用户身份而存储在用户本地终端(Client Side)上的数据,通常经过加密。
分类
Cookie总是保存在客户端中,按在客户端的存储位置,可以分为内存Cookie和硬盘Cookie。
内存Cookie有浏览器维护,保存在内存中,浏览器关闭以后就消失了,其存在时间是短暂的。硬盘Cookie是保存在硬盘里,有一个过期时间,除非用户手工清理或到了过期时间,硬盘Cookie不会被删除,其存在时间是长期的。所以,按存在时间,可分为非持久Cookie和持久Cookie。
用途
因为HTTP协议是无状态的,即服务器不知道用户上一次做了什么,严重阻碍了交互式Web应用程序等实现。例如,在购物场景中,Cookie记录用户访问信息,在结账时,服务器读取发送过来的Cookie就可以了。另一种应用是在登录网站时,保存用户登录信息。
缺陷
- Cookie会附加在每个HTTP请求中,所以无形中增加了流量。
- 由于HTTP请求中Cookie是明文传输,所以存在安全问题(除非用HTTPS)。
- Cookie的大小被限制在4KB左右,对于复杂的存储来说不够用。
在爬虫中应用
由于Cookie中存储用户信息,有些网站用Cookie做反爬依据,但是可以伪造。在有些需要登录的网站,可以预先登录好保存登录Cookie,然后摸你登录访问。
ip地址,DNS服务器
参考:http://www.cnblogs.com/songQQ/archive/2009/05/27/1490612.html
IP地址是32位二进制数据,通常以十进制表示,并以“.“分割。IP地址是一种逻辑地址,用来表示网络中的主机。IP地址有唯一性,即每台机器的IP地址全世界唯一的。
DNS是域名服务器,用来解析域名的(域名与IP之间的解析),如果没有DNS,必须输入网站的IP地址,有了DNS可以直接输入URL访问。
获取IP
参考:https://www.web-tinker.com/article/20064.html
客户端获取ip有两种,软性的,比如根据用户IP判断所在位置,这种需求是没有威胁的。硬性的,比如根据IP限制投票次数,这种需求虎队数据产生威胁。不同的需求,在PHP中有不同的获取IP的方法。