# https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=%E5%91%A8%E6%9D%B0%E4%BC%A6
# 需求, 获取https://www.baidu.com/s?wd=周杰伦的网页编码
import urllib.request
url = 'https://www.baidu.com/s?wd='
#请求对象的定制为了解决反爬的第一种手段
headers = {'user-agent':
'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36'}
#将周杰伦三个字变成unicode的格式
#我们需要以来于urllib.parse
name = urllib.parse.quote('周杰伦')
# print(name)
url = url + name
#请求对象的定制
request = urllib.request.Request(url=url, headers=headers)
#模拟浏览器向服务器发送请求
response = urllib.request.urlopen(request)
#获取相应的内容
content = response.read().decode('utf-8')
#打印数据
print(content)
Python爬虫:urllib_get请求的quote的方法(04)
于 2024-10-21 09:35:28 首次发布
2406

被折叠的 条评论
为什么被折叠?



