一、工具包urlllib和urllib2导入;
# GET和POST请求需要工具包urllib
import urllib
# 导入工具包
import urllib2
二、a)爬取网站对应的源码
# 通过资源定位符获取网页对象,通过read方法返回网页的源码
response = urllib2.urlopen("http://www.baidu.com")
print response.read()
b)将其写得规范一点,则如下所示
# 构造request请求实例
request = urllib2.Request("http://www.baidu.com")
response = urllib2.urlopen(request)
print response.read()

本文介绍了Python入门网络爬虫的基础,包括使用urllib和urllib2库获取网页源码,以及如何构造并发送POST和GET请求。
最低0.47元/天 解锁文章
1064

被折叠的 条评论
为什么被折叠?



