- 博客(3)
- 收藏
- 关注
原创 requests的简单使用
requests中如何解决乱码为什么会出现乱码:python解码和请求的网页编码不一样1.response.content.decode('utf-8')2.response.encoding = 'utf-8' response.textresponse.text和response.content的区别response.text类型:str修改编码⽅式:response.encoding = ‘utf-8’适用范围:文本response.content类型:bytes修改编码
2020-09-08 11:02:40
311
原创 HTTP和HTTPS协议
HTTP协议简介协议概念:通信计算机双⽅必须共同遵从的⼀组约定,只有遵守这个约定,计算机之间才能相互通信HTTP协议(HyperText Transfer Protocol,超⽂本传输协议):是⼀种发布和接收 HTML⻚⾯的⽅法。HTTPS(Hypertext Transfer Protocol over Secure Socket Layer)简单讲是HTTP的安全版,在HTTP下加⼊SSL层SSL(Secure Sockets Layer 安全套接层)主要⽤于Web的安全传输协议,在传输层对⽹
2020-09-03 22:17:58
824
原创 爬虫的简单介绍
爬虫的定义⽹络爬⾍(⼜被称为⽹⻚蜘蛛,⽹络机器⼈)就是模拟客户端发送⽹络请求,接收请求响应,⼀种按照⼀定的规则,⾃动地抓取互联⽹信息的程序。只要是浏览器能做的事情,原则上,爬⾍都能够做爬虫的用途12306抢票网站上的投票短信轰炸爬虫着么抓取网页上的数据⽹⻚三⼤特征:1 ⽹⻚都有⾃⼰唯⼀的URL2 ⽹⻚都是HTML来描述⻚⾯信息3 ⽹⻚都使⽤HTTP/HTTPS协议来传输HTML数据爬⾍的设计思路:1 确定需要爬取的URL地址2 通过HTTP/HTTPS协议获取对应的HTML⻚⾯3
2020-09-03 21:40:14
675
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人