python3定时爬虫

本文详细介绍如何使用Python制作网络爬虫,并提供了从环境搭建到定时任务设置的完整流程。包括在Linux环境下安装Python,利用虚拟环境管理依赖包,以及通过Cron实现爬虫程序的自动运行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(1)使用制作python爬虫

这篇文章足够带你学会如何制作爬虫:https://www.jianshu.com/p/486869f23959

(2)在linux搭建python环境,可以查看我搭建环境的随笔

http://www.cnblogs.com/mituxiaogaoyang/p/8656414.html

(3)在独立的虚拟环境中使用pip安装对应的依赖包(例如:pip install pymysql)

(4)在对应的spider文件夹下创建cron.sh脚本,内容如下:

1 #! /bin/sh                                                                                                                                            
2 PATH=$PATH:$HOME/.local/bin:$HOME/bin
3 export PATH="/home/python/.pyenv/bin:$PATH"
4 eval "$(pyenv init -)"
5 eval "$(pyenv virtualenv-init -)"
6 echo 'this is a new shell'
7 cd /home/python/zgc/projects/bdSpider/
8 nohup scrapy crawl bd >> bd.log 2>&1 &

(5)设置定时启动,即加入执行以上shell脚本的定时任务

crontab -e

 在弹出来的文件中写入以下代码:

*/1 * * * * /home/python/zgc/projects/bdSpider/cron.sh

 保存并退出即可。

 

转载于:https://www.cnblogs.com/mituxiaogaoyang/p/8657481.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值