python爬虫

最新推荐文章于 2025-12-02 14:13:48 发布

原创最新推荐文章于 2025-12-02 14:13:48 发布 · 389 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#爬虫 #python

python 专栏收录该内容

4 篇文章

订阅专栏

本文介绍了一个简单的Python爬虫程序，该程序使用urllib2模块从指定URL获取网页内容，并打印响应状态码、头部信息及数据。

#爬虫程序
import urllib2

def fetch(url):
    http_header = {'User-Agent': 'Chrome'}
    http_request = urllib2.Request(url, None, http_header)

    print "Start downloading data..."
    http_response = urllib2.urlopen(http_request)
    print "Finish downloading data..."

    print http_response.code

    print http_response.info()
    
    print "---------------data---------------"

    print http_response.open()

if __name__ == "__main__":
    fetch("http://www.baidu.com")