Python基础爬虫获取页面信息并保存到本地------Python

from urllib.request import urlopen
import sys
sys.stdout.reconfigure(encoding='utf-8')

resp = urlopen("https://www.baidu.com")

with open("baidu.html", mode="w",encoding="utf-8") as f:
    f.write(resp.read().decode("utf-8"))

from urllib.request import urlopen

import sys

sys.stdout.reconfigure(encoding='utf-8')

resp = urlopen("https://www.baidu.com")

with open("baidu.html", mode="w",encoding="utf-8") as f:

    f.write(resp.read().decode("utf-8"))

Cookie
User-Agent检测,主要是携带请求用户客户端的信息
复习知识:
请求行,请求方式,请求URL地址和协议
请求头,放一些服务器使用的附加信息
请求体,一般放一些请求参数
状态行,协议状态码
响应头,客户端的附加信息
响应体,服务器返回的客户端内容

Cookie
User-Agent检测,主要是携带请求用户客户端的信息
复习知识:
请求行,请求方式,请求URL地址和协议
请求头,放一些服务器使用的附加信息
请求体,一般放一些请求参数
状态行,协议状态码
响应头,客户端的附加信息
响应体,服务器返回的客户端内容

User-Agent:请求载体的身份标识
Referer:防盗链,请求是哪个页面过来的
cookie:本地字符串数据信息,用户登录信息,用于反爬虫的token
响应头的反爬字段

User-Agent:请求载体的身份标识
Referer:防盗链,请求是哪个页面过来的
cookie:本地字符串数据信息,用户登录信息,用于反爬虫的token
响应头的反爬字段

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值