scrapy-redis 实操应用----以4k风景为例

本文介绍如何使用Scrapy框架创建单机及分布式爬虫,针对netbian.com网站抓取壁纸图片,涵盖爬虫创建、配置及运行命令,适用于初学者实践。

首先,在终端打开redis数据库!

第一种(单机爬虫)创建命令:scrapy genspider -t crawl bizhi netbian.com

import scrapy
from scrapy.linkextractors import LinkExtractor
from scrapy.spiders import CrawlSpider, Rule


class BizhiSpider(CrawlSpider):
    name = 'bizhi'
    allowed_domains = ['netbian.com']
    start_urls = ['http://pic.netbian.com/4kfengjing/']

    page_link = LinkExtractor(allow='http://pic.netbian.com/4kfengjing/index_2.html')

    rules = (
        Rule(page_link, callback='get_detail', follow=True),
    )

    def get_detail(self,response):
        print('--------------------')
        li_list = response.xpath('//div[@class="slist"]/ul/li')
        # print(li_list)
        for li in li_list:

            img = li.xpath('.//a/img/@src').extract_first('')
            print(img)

            title =li.xpath('.//a/b/text()').extract_first('')
            print(title)

settings里面设置如下:

ITEM_PIPELINES = {
   'bizhispider.pipelines.BizhispiderPipeline': 300,
    'scrapy_redis.pipelines.RedisPipeline': 400,
}

#添加这两句代码
DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"
# 使用scrapy_redis的调度器,不使用scrapy默认的调度器
SCHEDULER = "scrapy_redis.scheduler.Scheduler"

终端运行命令:scrapy crawl bizhi  即可

第二种(分布式)命令:scrapy genspider fengjing  netbian.com

import scrapy
#引入
from scrapy_redis.spiders import RedisCrawlSpider
#两者选其一
#from scrapy_redis.spiders import RedisSpider,Rule

#继承RedisCrawlSpider
class FengjingSpider(RedisCrawlSpider):
    name = 'fengjing'
    allowed_domains = ['netbian.com']

    # start_urls = ['http://pic.netbian.com/4kfengjing/index_3.html']

    redis_key = 'fengjingspider:start_urls'

    #规则
   #rules = (
     #   Rule(page_link, callback='parse', follow=True),
   # )

    def parse(self, response):
        print('--------------------')
        li_list = response.xpath('//div[@class="slist"]/ul/li')
        # print(li_list)
        for li in li_list:
            img = li.xpath('.//a/img/@src').extract_first('')
            print(img)

            title = li.xpath('.//a/b/text()').extract_first('')
            print(title)

settings里面设置同上

终端运行命令:scrapy crawl fengjiang   等运行暂停后,打开一个新的cmd终端,输入命令:redis-cli 

然后输入命令:lpush + redis-key值 + 需要请求的url,程序即可继续运行。

内容概要:本文系统阐述了智能物流路径规划的技术体系与应用,涵盖其发展背景、核心问题建模、关键算法、多目标与动态环境处理、系统架构及典型应用场景。文章以车辆路径问题(VRP)及其变体为核心数学模型,介绍了从Dijkstra、A*等单智能体算法到多车VRP的元启发式求解方法(如遗传算法、蚁群算法、大规模邻域搜索),并深入探讨了多目标优化(成本、时间、碳排放)与动态环境(时订单、交通变化)下的自适应规划策略。结合城市配送、干线运输、场内物流等案,展示了路径规划在提升效率、降低成本方面的际价值,并分析了当前面临的复杂性、不确定性等挑战,展望了AI融合、数字孪生、车路协同等未来趋势。; 适合人群:具备一定物流、运筹学或计算机基础,从事智能交通、物流调度、算法研发等相关工作的技术人员与管理人员,工作年限1-5年为宜。; 使用场景及目标:①理解智能物流路径规划的整体技术架构与核心算法原理;②掌握VRP建模方法与多目标、动态环境下路径优化的现策略;③为物流系统设计、算法选型与系统优化提供理论依据与践参考; 阅读建议:建议结合文中案与数学模型,重点理解算法选择与际业务场景的匹配逻辑,关注动态规划与多目标优化的工程现难点,可配合仿真工具或开源求解器进行践验证。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值