8 爬虫 使用urllib2获取数据

本文介绍了Python 2.7中使用urllib2模块发起GET和POST请求的方法,并提供了具体的代码示例。同时,还提到了如何利用BeautifulSoup和JSON处理响应结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Python中的Urllib2

https://docs.python.org/2/library/urllib2.html

我的python版本:2.7

 

发起GET请求

http://kaoshi.edu.sina.com.cn/college/scorelist?tab=batch&wl=1&local=2&batch=&syear=2013


request = urllib2.Request(url=url, headers=headers)

response = urllib2.urlopen(request, timeout=20)

result = response.read()


 

发起POST请求

http://shuju.wdzj.com/plat-info-59.html


data = urllib.urlencode({'type1': x, 'type2': 0, 'status': 0, 'wdzjPlatId': int(platId)})

request = urllib2.Request('http://shuju.wdzj.com/depth-data.html', headers)

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor())

response = opener.open(request, data)

result = response.read()


 

处理返回结果

Html:BeautifulSoup,需要有一些CSS基础

API:JSON

https://www.crummy.com/software/BeautifulSoup/bs4/doc/

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值