使用python标准库urllib2访问网页

本文详细介绍了如何使用Python的urllib2库访问不需要登录的网页,并提供了通过创建带有cookie的opener进行登录操作的方法。重点包括登录流程的三个关键步骤:创建opener、提供用户/密码并访问登录页面、使用opener访问目标网页。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#访问不需要登录的网页
import urllib2
target_page_url='http://10.224.110.118/myweb/view.jsp'
f = urllib2.urlopen(target_page_url)
httpCodes=f.getcode()
responseStr = f.read()
f.close()
successful= httpCodes in [200,201,202]
#print(responseStr)
######访问需要登录的网页
#步骤1. 创建一个带有cookie的opener
#步骤2. 提供用户/密码, 用这个opener访问登录action url.

#         因为触发了login_action, web 服务器端就会为这个用户初始化session
#步骤3. 还是使用这个opener访问目标网页.
import urllib, urllib2, cookielib
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
login_data = urllib.urlencode({'employeeNo' : 'abcd', 'password' : 'xxxx'})
login_action_url='http://10.224.110.118/myweb/userlogin'
f=opener.open(login_action_url, login_data)
#responseStr = f.read()
target_page_url='http://10.224.110.118/myweb/index.jsp'
f=opener.open(target_page_url)
httpCodes=f.getcode()
responseStr = f.read()
f.close()
opener.close()
successful= httpCodes in [200,201,202]
#print(responseStr)
上面是使用urllib2的示例, 初步看了一下requests包, session(对于客户端来讲, 即cookie)可使用上下文方式来写, 更直观一些.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值