Python爬虫基础-HTTP基本原理-HTTP和HTTPS

在网页中,URL的开头会有http或https,这就是访问资源需要的协议类型。有时,我们还会看到ftp、sftp、smb开头的URL,它们都是协议类型。
**HTTP的全称是Hyper Text Transfer Protocol,中文名叫作超文本传输协议。**HTTP协议是用于从网络传输超文本数据到本地浏览器的传送协议,它能保证高效而准确地传送超文本文档。HTTP由万维网(World Wide Web Consortium)和Internet工作小组IETF(Internet Engineering Task Force)共同合作指定的规范。目前广泛使用的是HTTP 1.1版本。
HTTPS的全称是 Hyper Text Transfer Protocol over Secure Socket Layer,是以安全为目标的HTTP通道,简单讲是HTTP的安全版,即HTTP下加入SSL层,简称为HTTPS。
HTTPS的安全基础是SSL,因此通过它传输的内容都是经过SSL加密的,它的主要作用可以分为两种。
1.建立一个信息安全通道来保证数据传输的安全。
2.确认网站的真实性,凡是使用了HTTPS的网站,都可以通过点击浏览器地址栏的锁头标志来查看网站认证之后的真实信息,也可以通过CA机构颁发的安全签章来查询。
而某些网站索然使用了HTTPS协议,但还是会被浏览器提示不安全,如果要爬取这样的站点,就需要设置忽略证书的选项,否则会提示SSL连接错误。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值