使用Python urllib2下载优快云博客列表到本地

本文详细介绍了如何使用Python脚本从优快云博客网站下载特定页面的内容,并将其保存为本地文件。通过输入地址和页码,实现自动化获取和存储博客信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# -*- coding: utf-8 -*-
import string, urllib2

# 下载优快云博客列表
def load_csdn(url, page):
    name = string.zfill(page, 5) + '.html'
    print '正在下载' + str(page) + '个页面,并存储其为' + name

    f = open(name, 'w+')
    url = url + '/' + str(page)
    print url

    # 伪装成浏览器
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.101 Safari/537.36'
    }
    req = urllib2.Request(url = url,headers = headers)
    m = urllib2.urlopen(req).read()
    
    f.write(m)
    f.close()

# http://blog.youkuaiyun.com/Geek_ymv/article/list/2

url = str(raw_input(u'请输入地址:'))
page = int(raw_input(u'请输入第几页:'))

# 下载网页到本地
load_csdn(url, page)
    

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值