session与cookies

Session是由应用服务器维持的一个服务器端的存储空间,用户在连接服务器时,会由服务器生成一个唯一的SessionID,用该SessionID 为标识符来存取服务器端的Session存储空间。而SessionID这一数据则是保存到客户端,用Cookie保存的,用户提交页面时,会将这一 SessionID提交到服务器端,来存取Session数据。这一过程,是不用开发人员干预的。所以一旦客户端禁用Cookie,那么Session也会失效。

服务器也可以通过URL重写的方式来传递SessionID的值,因此不是完全依赖Cookie。如果客户端Cookie禁用,则服务器可以自动通过重写URL的方式来保存Session的值,并且这个过程对程序员透明。

可以试一下,即使不写Cookie,在使用request.getCookies();取出的Cookie数组的长度也是1,而这个Cookie的名字就是JSESSIONID,还有一个很长的二进制的字符串,是SessionID的值。

Cookie是客户端的存储空间,由浏览器来维持。
 
在一些投票之类的场合,我们往往因为公平的原则要求每人只能投一票,在一些WEB开发中也有类似的情况,这时候我们通常会使用COOKIE来实现,例如如下的代码:
< % cookie[]cookies = request.getCookies();
if (cookies.lenght == 0 || cookies == null)
  doStuffForNewbie();
//没有访问过  
}

else
{
  doStuffForReturnVisitor(); //已经访问过了
}

% >


      这是很浅显易懂的道理,检测COOKIE的存在,如果存在说明已经运行过写入COOKIE的代码了,然而运行以上的代码后,无论何时结果都是执行doStuffForReturnVisitor(),通过控制面板-Internet选项-设置-察看文件却始终看不到生成的cookie文件,奇怪,代码明明没有问题,不过既然有cookie,那就显示出来看看。
cookie[]cookies = request.getCookies();
if (cookies.lenght == 0 || cookies == null)
  out.println("Has not visited this website");
}

else
{
  for (int i = 0; i < cookie.length; i++)
  {
    out.println("cookie name:" + cookies[i].getName() + "cookie value:" +
        cookie[i].getValue());
  }
}


        运行结果:
cookie name:JSESSIONID cookie value:KWJHUG6JJM65HS2K6

为什么会有cookie呢,大家都知道,http是无状态的协议,客户每次读取web页面时,服务器都打开新的会话,而且服务器也不会自动维护客户的上下文信息,那么要怎么才能实现网上商店中的购物车呢,session就是一种保存上下文信息的机制,它是针对每一个用户的,变量的值保存在服务器端,通过SessionID来区分不同的客户,session是以cookie或URL重写为基础的,默认使用cookie来实现,系统会创造一个名为JSESSIONID的输出cookie,我们叫做session cookie,以区别persistent cookies,也就是我们通常所说的cookie,注意session cookie是存储于浏览器内存中的,并不是写到硬盘上的,这也就是我们刚才看到的JSESSIONID,我们通常情是看不到JSESSIONID的,但是当我们把浏览器的cookie禁止后,web服务器会采用URL重写的方式传递Sessionid,我们就可以在地址栏看到sessionid=KWJHUG6JJM65HS2K6之类的字符串。
        明白了原理,我们就可以很容易的分辨出persistent cookies和session cookie的区别了,网上那些关于两者安全性的讨论也就一目了然了,session cookie针对某一次会话而言,会话结束session cookie也就随着消失了,而persistent cookie只是存在于客户端硬盘上的一段文本(通常是加密的),而且可能会遭到cookie欺骗以及针对cookie的跨站脚本攻击,自然不如session cookie安全了。
        通常session cookie是不能跨窗口使用的,当你新开了一个浏览器窗口进入相同页面时,系统会赋予你一个新的sessionid,这样我们信息共享的目的就达不到了,此时我们可以先把sessionid保存在persistent cookie中,然后在新窗口中读出来,就可以得到上一个窗口SessionID了,这样通过session cookie和persistent cookie的结合我们就实现了跨窗口的session tracking(会话跟踪)。
        在一些web开发的书中,往往只是简单的把Session和cookie作为两种并列的http传送信息的方式,session cookies位于服务器端,persistent cookie位于客户端,可是session又是以cookie为基础的,明白的两者之间的联系和区别,我们就不难选择合适的技术来开发web service了
<think>好的,我现在需要帮助用户解决关于使用Python的requests库中的session提取cookies的问题。首先,用户之前遇到了TooManyRedirects的错误,可能是在处理认证或会话时出现了问题。现在用户询问如何提取cookies,这可能之前的重定向问题有关联。 首先,我要回顾用户的历史对话。之前的错误提示显示,用户在使用session.post时触发了超过30次的重定向。我的回复中提到了可能需要检查cookies是否正确携带,所以用户现在可能想确认如何正确提取和管理cookies,以避免重定向循环。 接下来,我需要思考用户可能的场景。用户可能在编写一个自动化脚本,用于某个网站交互,比如登录后提交表单。由于重定向问题,用户需要确保session正确保存了cookies,以便后续请求能够维持会话状态。用户可能不太清楚如何从session中提取cookies,或者在提取后如何正确使用它们。 用户的需求是什么?表面上是如何提取cookies,但深层需求可能是确保会话状态正确,避免因cookies问题导致的重定向或认证失败。用户可能遇到的情况包括:登录后cookies未正确保存,后续请求没有携带必要的cookies,或者需要跨session使用cookies。 接下来,我需要组织回答的结构。首先介绍基本方法,展示如何从session中提取cookies,然后说明如何手动设置cookies到新的请求中。接着,提供验证步骤,确保cookies正确应用。此外,要加入高级技巧,比如使用钩子函数或持久化存储,帮助用户更灵活地处理cookies。最后,安全注意事项也很重要,提醒用户保护敏感信息。 我需要确保回答清晰,步骤明确,并给出代码示例。例如,使用session.cookies.get_dict()来获取cookies字典,或者直接访问特定的cookie值。同时,需要强调在跨session使用时正确应用cookies的方法,比如在headers中添加Cookie头,或者使用RequestsCookieJar对象。 还要考虑用户可能的错误,比如没有正确处理cookies的更新。例如,某些网站可能在重定向时更新cookies,用户需要确保每次请求后都更新cookies存储。此外,用户可能没有注意到某些cookies是HttpOnly,无法通过脚本访问,这可能需要其他方法处理。 需要提醒用户验证cookies是否正确,可以通过打印输出或调试工具检查。同时,高级技巧中的流量抓包和钩子函数可以帮助用户更深入地调试问题。最后,安全部分要强调不要泄露敏感cookies,避免安全风险。 总结,用户需要的是从session中提取cookies的具体方法,以及如何正确使用这些cookies来维持会话状态,解决之前的重定向问题。回答需要覆盖基本提取、手动应用、验证步骤、高级技巧和安全提示,确保用户能够全面理解和应用。</think>以下是关于在Python `requests`库中从`Session`对象提取和管理Cookies的详细指南: --- ### **1. 基础Cookie提取方法** #### **1.1 查看Session中所有Cookies** ```python import requests session = requests.Session() response = session.get("https://example.com/login") # 方法1:获取Cookies字典 cookies_dict = session.cookies.get_dict() print("当前Cookies字典:", cookies_dict) # 方法2:获取RequestsCookieJar对象(完整属性) cookies_jar = session.cookies print("完整Cookie对象:", cookies_jar) # 方法3:遍历单个Cookie for cookie in cookies_jar: print(f"名称: {cookie.name}, 值: {cookie.value}, 过期时间: {cookie.expires}") ``` #### **1.2 提取指定Cookie** ```python # 获取特定Cookie的值(Key不存在返回None) auth_token = session.cookies.get("session_id") print("关键认证令牌:", auth_token) ``` --- ### **2. 手动应用Cookies** #### **2.1 跨Session复用Cookies** ```python # 创建新Session并注入之前获取的Cookies new_session = requests.Session() # 方法A:通过字典设置 new_session.cookies.update(cookies_dict) # 方法B:直接操作CookieJar for cookie in cookies_jar: new_session.cookies.set_cookie(cookie) ``` #### **2.2 单次请求携带Cookies** ```python # 通过headers传递(原始字符串格式) headers = { "Cookie": f"session_id={auth_token}; user_lang=zh-CN" } # 通过cookies参数传递(推荐字典格式) requests.get("https://example.com/data", cookies=cookies_dict) ``` --- ### **3. 关键验证步骤** #### **3.1 实时监控Cookies变化** ```python # 定义调试钩子函数 def cookie_monitor(response, *args, **kwargs): print("\n[COOKIE监控]") print("请求URL:", response.request.url) print("新Cookies:", response.cookies.get_dict()) # 绑定到Session session = requests.Session() session.hooks['response'].append(cookie_monitor) # 触发请求时自动输出变化 session.get("https://example.com") ``` #### **3.2 验证Cookie有效性** ```python # 检查是否包含必要凭证 required_cookies = ["session_id", "csrf_token"] missing = [c for c in required_cookies if c not in session.cookies] if missing: raise Exception(f"缺少关键Cookie: {missing}") # 验证Cookie作用域 target_domain = "example.com" if not any(c.domain == target_domain for c in session.cookies): raise Exception("Cookie作用域不匹配") ``` --- ### **4. 高级技巧** #### **4.1 持久化存储Cookies** ```python import json import http.cookiejar # 保存到文件(Mozilla格式) session.cookies.save(ignore_discard=True, ignore_expires=True) # 从文件加载 session.cookies = http.cookiejar.MozillaCookieJar() session.cookies.load("cookies.txt", ignore_discard=True, ignore_expires=True) # JSON序列化(适合临时存储) with open("cookies.json", "w") as f: json.dump(requests.utils.dict_from_cookiejar(session.cookies), f) ``` #### **4.2 处理动态Cookie更新** ```python # 强制更新Cookie(应对服务端刷新) redirect_response = session.post("https://example.com/update") session.cookies.update(redirect_response.cookies) ``` --- ### **5. 安全注意事项** 1. **敏感信息保护**: - 避免日志中记录`Set-Cookie`头 - 使用`cookie.secure`属性验证是否仅通过HTTPS传输 2. **作用域限制**: ```python # 检查Cookie是否允许跨域 if any(not c.restricted for c in session.cookies): print("警告:存在非安全作用域Cookie") ``` 3. **过期管理**: ```python # 自动清理过期Cookie session.cookies.clear_expired_cookies() ``` --- ### **典型问题排查** | 现象 | 解决方案 | |-------|-------| | 登录后Cookie未保存 | 检查响应状态码是否为200/302,确认服务端实际返回了Cookie | | Cookie跨域失效 | 验证`domain`和`path`属性是否匹配目标URL | | 部分Cookie丢失 | 使用`session.cookies = requests.cookies.merge_cookies()`合并新旧 | --- 通过以上方法,您可以精确控制Cookie的提取和应用过程。如果遇到特定网站的特殊Cookie机制(如`HttpOnly`标志或加密Cookie),建议结合浏览器开发者工具进行网络请求对比分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值