获取一个网站cookie的name和values:
通过cookiejar获取目标的cookie,返回可迭代对象,对其进行遍历,拆解为字典更方便操作。
# coding:utf-8
"""
获取请求信息的cookie值,反回一个可迭代的对象
"""
from urllib import request
from http import cookiejar
def get_cookies(url):
# 声明一个CookieJar对象实例来保存cookie
cookie = cookiejar.CookieJar()
# 利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler
handler=request.HTTPCookieProcessor(cookie)
# 通过CookieHandler创建opener
opener = request.build_opener(handler)
# 此处的open方法打开网页
response = opener.open(url)
# 返回cookie信息
return get_kv(cookie)
def get_kv(cookies):
# 把cookies拆解为字典
cookies_dict = {}
for item in cookies:
cookies_dict[item.name] = item.value
return cookies_dict

本文介绍了一种使用Python的urllib和http.cookiejar模块获取网站Cookie的方法,通过创建CookieJar对象和Cookie处理器,实现对指定URL的Cookie进行抓取,并将其转化为字典形式,便于进一步的数据处理。
2924

被折叠的 条评论
为什么被折叠?



