爬虫经典6大步骤

SYTt_t

于 2020-03-30 20:52:56 发布

阅读量265

点赞数

分类专栏： Python

本文链接：https://blog.youkuaiyun.com/qq_39817609/article/details/105208269

版权

Python 专栏收录该内容

18 篇文章

订阅专栏

#1.导包

from urllib.request import Request,urlopen
from urllib.parse import urlencode
from fake_useragent import UserAgent

args = {
        "wd": "尚学堂",
        "ie": "utf-8"
    }
#2.头部
headers = {
    "User-Agent":UserAgent().random #随机获取
    }

#print(urlencode(args))

#3.url（请求网址的确定，如果遇到有中文，则用urllib.parse.quote('尚学堂')或者如下）
url = "https://www.baidu.com/s?{}".format(urlencode(args))

#4.开始请求，把要请求的网址和头部扔进去
request = Request(url,headers=headers)

#5.等待响应
response = urlopen(request)

#6.把响应的内容读取出来给了info
info = response.read()

print(info.decode())