python2.7如何实现每天定时抓取网页?

# -*- coding: utf-8 -*-
"""
Created on Wed May 02 16:43:10 2018

@author: TY
"""

# coding:utf8
#引入时间模块
import datetime
import time

#定义一个爬虫函数,用来实现爬虫功能
def pachong():
    # 把爬虫程序放在这个类里
    print '爬虫已经工作完毕!'


# 定义一个函数,用来判断时间
def main(h, m):
    #判断当地时间与设定时间是否吻合
    if h == 1 and m == 0:
        pachong()
        #break
    elif h == 17 and m == 5:
        pachong()
        #break
    else:
        # 每隔60秒检测一次
        print '主人稍安勿燥,爬虫正在等待时间。。。'
        #每隔60秒调用一次nowtime函数,重新做一次判断
        time.sleep(60)
        nowtime()
    print '程序结束!'

#定义一个函数,用于提取当前时间
def nowtime():
    #输出当前时间,并且赋值给hour和minute
    now = datetime.datetime.now()
    print(now.hour, now.minute)
    hour = now.hour
    minute = now.minute
    main(hour,minute)

#调用nowtime函数,判断时间
nowtime()

主要通过不断的调用函数做判断,看是否满足要求,如果满足要求才进行抓取数据

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值