python爬虫cookie的使用包括已经登录和未登录两种情况

最新推荐文章于 2024-06-29 08:30:00 发布

原创最新推荐文章于 2024-06-29 08:30:00 发布 · 1.5k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #爬虫 #http

小白学python 同时被 3 个专栏收录

19 篇文章

订阅专栏

学会就能进大厂

19 篇文章

订阅专栏

零基础学python

18 篇文章

订阅专栏

本文介绍了如何在Python爬虫中使用cookie，包括已登录和未登录两种情况。通过示例代码展示了登录过程，并利用HTTPCookieProcessor处理cookie，访问音乐网站获取已登录状态的页面源代码。

记录的身份信息 cookie
已经登陆过的cookie来进入网站
在这里插入图片描述 在这里插入代码片

没有登陆过的cookie来进入网站
在这里插入图片描述 from urllib.request import Request,urlopen
from fake_useragent import UserAgent
from urllib.parse import urlencode
from urllib.request import HTTPCookieProcessor,build_opener
#登录
login_url = “https://music.163.com/weapi/login/qrcode/client/login?csrf_token=”
headers = {
“User-Agent”:UserAgent
}
form_data = {
“user”:“12312412345”,
“passwword”:“1q3ww131”
}
f_data = urlencode(form_data)
request = Request(login_url,headers = headers,data = f_data)
handler = HTTPCookieProcessor()
opener = build_opener(handler)
response = urlopen(request)
response = opener.open(request)
#访问页面
info_url = “https://music.163.com/”
request = Request(info_url,headers = headers)
response = opener.open(request)
print(response.read().decode())
已登录的源代码

from urllib.request import Request,urlopen
from fake_useragent import UserAgent
url = "https://music.163.com/"
headers = {
    "User-Agent":UserAgent
    "Cookie":"_ntes_nnid=9cb6ff3314be2f27234c191923be4967,1620718658806"
}
request = Request(url,headers = headers)
response = urlopen(request)
print(response.read().decode())

#未登录的源代码
from urllib.request import Request,urlopen
from fake_useragent import UserAgent
from urllib.parse import urlencode
from urllib.request import HTTPCookieProcessor,build_opener
#登录
login_url = "https://music.163.com/weapi/login/qrcode/client/login?csrf_token="
headers = {
    "User-Agent":UserAgent
}
form_data = {
    "user":"12312412345",
    "passwword":"1q3ww131"
}
f_data = urlencode(form_data)
request = Request(login_url,headers = headers,data = f_data)
handler = HTTPCookieProcessor()
opener = build_opener(handler)
response = urlopen(request)
response = opener.open(request)
#访问页面
info_url = "https://music.163.com/"
request = Request(info_url,headers = headers)
response = opener.open(request)
print(response.read().decode())