
网络爬虫
带你深入浅出掌握爬虫原理,带你玩转requests第三方库以及重量级爬虫框架Scrapy,通俗讲解各平台反爬机制,精通爬虫不是梦。
Pythonicc
专注全栈开发、web逆向工程、践行DevOps理念。
雅思6.0、PMP项目管理专家、CKA(Certified Kubernetes Administrator)。
展开
-
HTTP/HTTPS的请求与响应【python爬虫小课堂】
HTTP和HTTPSHTTP协议(HyperText Transfer Protocol,超文本传输协议):是一种发布和接收 HTML页面的方法。HTTPS(Hypertext Transfer Protocol over Secure Socket Layer)简单讲是HTTP的安全版,在HTTP下加入SSL层。SSL(Secure Sockets Layer 安全套接层)主要用于Web的安全传输协议,在传输层对网络连接进行加密,保障在Internet上数据传输的安全。HTTP的端口号为80,.原创 2020-05-23 10:42:42 · 71510 阅读 · 0 评论 -
str与bytes的区别【python爬虫小课堂】
bytesbytes对象只负责以二进制字节序列的形式记录所需记录的对象,至于该对象到底表示什么(比如到底是什么字符)则由相应的编码格式解码所决定Python2 中>>> type(b'xxxxx')<type 'str'>>>> type('xxxxx')<type 'str'>Python3 中>>> type(b'xxxxx')<class 'bytes'>>>> type(原创 2020-05-23 10:38:52 · 65972 阅读 · 0 评论 -
Requests简单使用【python爬虫小课堂】
Requests: 让 HTTP 服务人类虽然Python的标准库中 urllib 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更简洁方便。Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用:)Requests 继承了urllib的所有特性。Requests支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码原创 2020-05-23 02:48:39 · 66192 阅读 · 0 评论