session与cookies区别

本文深入解析了Cookie与Session机制在Web开发中的应用,详细介绍了Cookie的存储方式、作用范围及过期时间特性,以及Session机制的工作原理、与Cookie的关系和区别。重点阐述了两者在个性化服务、用户认证等方面的应用,并对比了它们在安全性、存储位置和性能方面的差异。
这些都是基础知识,不过有必要做深入了解。先简单介绍一下。

二者的定义:

当你在浏览网站的时候,WEB 服务器会先送一小小资料放在你的计算机上,Cookie 会帮你在网站上所打的文字或是一些选择,

都纪录下来。当下次你再光临同一个网站,WEB 服务器会先看看有没有它上次留下的 Cookie 资料,有的话,就会依据 Cookie

里的内容来判断使用者,送出特定的网页内容给你。 Cookie 的使用很普遍,许多有提供个人化服务的网站,都是利用 Cookie

来辨认使用者,以方便送出使用者量身定做的内容,像是 Web 接口的免费 email 网站,都要用到 Cookie。


具体来说cookie机制采用的是在客户端保持状态的方案,而session机制采用的是在服务器端保持状态的方案。

同时我们也看到,由于采用服务器端保持状态的方案在客户端也需要保存一个标识,所以session机制可能需要借助于cookie机制

来达到保存标识的目的,但实际上它还有其他选择。

cookie机制。正统的cookie分发是通过扩展HTTP协议来实现的,服务器通过在HTTP的响应头中加上一行特殊的指示以提示

浏览器按照指示生成相应的cookie。然而纯粹的客户端脚本如JavaScript或者VBScript也可以生成cookie。而cookie的使用

是由浏览器按照一定的原则在后台自动发送给服务器的。浏览器检查所有存储的cookie,如果某个cookie所声明的作用范围

大于等于将要请求的资源所在的位置,则把该cookie附在请求资源的HTTP请求头上发送给服务器。

cookie的内容主要包括:名字,值,过期时间,路径和域。路径与域一起构成cookie的作用范围。[b]若不设置过期时间,则表示这

个cookie的生命期为浏览器会话期间,关闭浏览器窗口,cookie就消失。这种生命期为浏览器会话期的cookie被称为会话cookie。

会话cookie一般不存储在硬盘上而是保存在内存里,当然这种行为并不是规范规定的。若设置了过期时间,浏览器就会把cookie

保存到硬盘上,关闭后再次打开浏览器,这些cookie仍然有效直到超过设定的过期时间。存储在硬盘上的cookie可以在不同的浏

览器进程间共享,比如两个IE窗口。而对于保存在内存里的cookie,不同的浏览器有不同的处理方式 [/b]

session机制。session机制是一种服务器端的机制,服务器使用一种类似于散列表的结构(也可能就是使用散列表)来保存信息。

当程序需要为某个客户端的请求创建一个session时,服务器首先检查这个客户端的请求里是否已包含了一个session标识

(称为session id),如果已包含则说明以前已经为此客户端创建过session,服务器就按照session id把这个session检索出来

使用(检索不到,会新建一个),如果客户端请求不包含session id,则为此客户端创建一个session并且生成一个与此session相

关联的session id,session id的值应该是一个既不会重复,又不容易被找到规律以仿造的字符串,这个session id将被在本次响应

中返回给客户端保存。保存这个session id的方式可以采用cookie,这样在交互过程中浏览器可以自动的按照规则把这个标识发送给

服务器。一般这个cookie的名字都是类似于SEEESIONID。但cookie可以被人为的禁止,则必须有其他机制以便在cookie被禁止时

仍然能够把session id传递回服务器。

经常被使用的一种技术叫做URL重写,就是把session id直接附加在URL路径的后面。还有一种技术叫做表单隐藏字段。就是服务器

会自动修改表单,添加一个隐藏字段,以便在表单提交时能够把session id传递回服务器。比如:
<form name="testform" action="/xxx">
<input type="hidden" name="jsessionid" value="ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764">
<input type="text">
</form>
实际上这种技术可以简单的用对action应用URL重写来代替。

cookie 和session 的区别:

1、cookie数据存放在客户的浏览器上,session数据放在服务器上。

2、cookie不是很安全,别人可以分析存放在本地的COOKIE并进行COOKIE欺骗
考虑到安全应当使用session

3、session会在一定时间内保存在服务器上。当访问增多,会比较占用你服务器的性能
考虑到减轻服务器性能方面,应当使用COOKIE

4、单个cookie在客户端的限制是3K,就是说一个站点在客户端存放的COOKIE不能3K。

5、所以个人建议:
将登陆信息等重要信息存放为SESSION
其他信息如果需要保留,可以放在COOKIE中

施杨出品!!!
<think>好的,我现在需要帮助用户解决关于使用Python的requests库中的session提取cookies的问题。首先,用户之前遇到了TooManyRedirects的错误,可能是在处理认证或会话时出现了问题。现在用户询问如何提取cookies,这可能之前的重定向问题有关联。 首先,我要回顾用户的历史对话。之前的错误提示显示,用户在使用session.post时触发了超过30次的重定向。我的回复中提到了可能需要检查cookies是否正确携带,所以用户现在可能想确认如何正确提取和管理cookies,以避免重定向循环。 接下来,我需要思考用户可能的场景。用户可能在编写一个自动化脚本,用于某个网站交互,比如登录后提交表单。由于重定向问题,用户需要确保session正确保存了cookies,以便后续请求能够维持会话状态。用户可能不太清楚如何从session中提取cookies,或者在提取后如何正确使用它们。 用户的需求是什么?表面上是如何提取cookies,但深层需求可能是确保会话状态正确,避免因cookies问题导致的重定向或认证失败。用户可能遇到的情况包括:登录后cookies未正确保存,后续请求没有携带必要的cookies,或者需要跨session使用cookies。 接下来,我需要组织回答的结构。首先介绍基本方法,展示如何从session中提取cookies,然后说明如何手动设置cookies到新的请求中。接着,提供验证步骤,确保cookies正确应用。此外,要加入高级技巧,比如使用钩子函数或持久化存储,帮助用户更灵活地处理cookies。最后,安全注意事项也很重要,提醒用户保护敏感信息。 我需要确保回答清晰,步骤明确,并给出代码示例。例如,使用session.cookies.get_dict()来获取cookies字典,或者直接访问特定的cookie值。同时,需要强调在跨session使用时正确应用cookies的方法,比如在headers中添加Cookie头,或者使用RequestsCookieJar对象。 还要考虑用户可能的错误,比如没有正确处理cookies的更新。例如,某些网站可能在重定向时更新cookies,用户需要确保每次请求后都更新cookies存储。此外,用户可能没有注意到某些cookies是HttpOnly,无法通过脚本访问,这可能需要其他方法处理。 需要提醒用户验证cookies是否正确,可以通过打印输出或调试工具检查。同时,高级技巧中的流量抓包和钩子函数可以帮助用户更深入地调试问题。最后,安全部分要强调不要泄露敏感cookies,避免安全风险。 总结,用户需要的是从session中提取cookies的具体方法,以及如何正确使用这些cookies来维持会话状态,解决之前的重定向问题。回答需要覆盖基本提取、手动应用、验证步骤、高级技巧和安全提示,确保用户能够全面理解和应用。</think>以下是关于在Python `requests`库中从`Session`对象提取和管理Cookies的详细指南: --- ### **1. 基础Cookie提取方法** #### **1.1 查看Session中所有Cookies** ```python import requests session = requests.Session() response = session.get("https://example.com/login") # 方法1:获取Cookies字典 cookies_dict = session.cookies.get_dict() print("当前Cookies字典:", cookies_dict) # 方法2:获取RequestsCookieJar对象(完整属性) cookies_jar = session.cookies print("完整Cookie对象:", cookies_jar) # 方法3:遍历单个Cookie for cookie in cookies_jar: print(f"名称: {cookie.name}, 值: {cookie.value}, 过期时间: {cookie.expires}") ``` #### **1.2 提取指定Cookie** ```python # 获取特定Cookie的值(Key不存在返回None) auth_token = session.cookies.get("session_id") print("关键认证令牌:", auth_token) ``` --- ### **2. 手动应用Cookies** #### **2.1 跨Session复用Cookies** ```python # 创建新Session并注入之前获取的Cookies new_session = requests.Session() # 方法A:通过字典设置 new_session.cookies.update(cookies_dict) # 方法B:直接操作CookieJar for cookie in cookies_jar: new_session.cookies.set_cookie(cookie) ``` #### **2.2 单次请求携带Cookies** ```python # 通过headers传递(原始字符串格式) headers = { "Cookie": f"session_id={auth_token}; user_lang=zh-CN" } # 通过cookies参数传递(推荐字典格式) requests.get("https://example.com/data", cookies=cookies_dict) ``` --- ### **3. 关键验证步骤** #### **3.1 实时监控Cookies变化** ```python # 定义调试钩子函数 def cookie_monitor(response, *args, **kwargs): print("\n[COOKIE监控]") print("请求URL:", response.request.url) print("新Cookies:", response.cookies.get_dict()) # 绑定到Session session = requests.Session() session.hooks['response'].append(cookie_monitor) # 触发请求时自动输出变化 session.get("https://example.com") ``` #### **3.2 验证Cookie有效性** ```python # 检查是否包含必要凭证 required_cookies = ["session_id", "csrf_token"] missing = [c for c in required_cookies if c not in session.cookies] if missing: raise Exception(f"缺少关键Cookie: {missing}") # 验证Cookie作用域 target_domain = "example.com" if not any(c.domain == target_domain for c in session.cookies): raise Exception("Cookie作用域不匹配") ``` --- ### **4. 高级技巧** #### **4.1 持久化存储Cookies** ```python import json import http.cookiejar # 保存到文件(Mozilla格式) session.cookies.save(ignore_discard=True, ignore_expires=True) # 从文件加载 session.cookies = http.cookiejar.MozillaCookieJar() session.cookies.load("cookies.txt", ignore_discard=True, ignore_expires=True) # JSON序列化(适合临时存储) with open("cookies.json", "w") as f: json.dump(requests.utils.dict_from_cookiejar(session.cookies), f) ``` #### **4.2 处理动态Cookie更新** ```python # 强制更新Cookie(应对服务端刷新) redirect_response = session.post("https://example.com/update") session.cookies.update(redirect_response.cookies) ``` --- ### **5. 安全注意事项** 1. **敏感信息保护**: - 避免日志中记录`Set-Cookie`头 - 使用`cookie.secure`属性验证是否仅通过HTTPS传输 2. **作用域限制**: ```python # 检查Cookie是否允许跨域 if any(not c.restricted for c in session.cookies): print("警告:存在非安全作用域Cookie") ``` 3. **过期管理**: ```python # 自动清理过期Cookie session.cookies.clear_expired_cookies() ``` --- ### **典型问题排查** | 现象 | 解决方案 | |-------|-------| | 登录后Cookie未保存 | 检查响应状态码是否为200/302,确认服务端实际返回了Cookie | | Cookie跨域失效 | 验证`domain`和`path`属性是否匹配目标URL | | 部分Cookie丢失 | 使用`session.cookies = requests.cookies.merge_cookies()`合并新旧 | --- 通过以上方法,您可以精确控制Cookie的提取和应用过程。如果遇到特定网站的特殊Cookie机制(如`HttpOnly`标志或加密Cookie),建议结合浏览器开发者工具进行网络请求对比分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值