Python网页下载器urllib2

本文介绍了使用Python进行网页抓取的三种方法:直接使用urllib2.urlopen获取网页内容、通过构造Request对象请求网页并设置头部信息、利用CookieJar管理Cookies进行网页抓取。通过这些方法,可以高效地实现网页信息的抓取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

方式一

import urllib2
response = urllib2.urlopen('http://www.baidu.com')
print response.getcode()
cont = response.read()

方式二

import urllib2
request = urllib2.Request(url)
request.add_data('a','1')
request.add_header('User-Agent','Mozilla/5.0')
response=urllib2.urlopen(request)

方式三

import urllib2,cookielib
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
urllib2.install_opener(opener)
response=urllib2.urlopen("http://www.baidu.com")
for html in response:
    print html

测试第一种和第三种是可以的,第二种add_data方法参数应该是三个,会报错。
感觉python的网页下载比java真的是好多了,java编写一共爬起网页的util,曾经干过这个活,代码量真的好多。

专业墙纸贴纸厨房用具装饰出售,本人网店经营,访问即是爱

博客对你有用记得访问下哦,增加下访问量,如有需要可以下单购买哦^_^。店铺地址https://item.taobao.com/item.htm?id=570637716145

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

黄宝康

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值