scrapy框架

一、来自scrapy框架的数据项加载器处理器代码

# -- coding: utf-8 --
  import scrapy
  import scrapy.loader
  from scrapy.loader.processors import Join, MapCompose, TakeFirst

class TencentItemSpider(scrapy.Spider):
  name = ‘tencent_item’
  allowed_domains = [‘ke.qq.com’]
  start_urls = [‘https://ke.qq.com/course/list?mt=1001&st=2002&tt=3019&price_min=1&page=1’]

def parse(self, response):
  item = JobscrapyItem()
  # loader = scrapy.loader.ItemLoader(item=item,selector=response.selector)
  # loader = scrapy.loader.ItemLoader(item=item, response=response)

# 测试xpath的代码
  # price = response.xpath(’/html/body//section/div/div/ul/li/div/span[@class=“line-cell item-price”]/text()’)
  # print(‘self:’, len(price), price.getall())
  # company_name = response.xpath(’/html/body//section/div/div/ul/li/div/span/a/text()’)
  # print(‘self:’, len(company_name), company_name.getall())

course_list = response.xpath(’/html/body//section[@class=“main autoM clearfix”]/div/div/ul/li’)
  print(len(course_list))
  for course_ in course_list:
  # loader = scrapy.loader.ItemLoader(item=item, selector=course_)
  loader = CourseItemLoader(item=item, selector=course_)
  loader.add_xpath(‘company_name’, ‘div/span/a/text()’)
  loader.add_xpath(‘course_price’, ‘div/span[@class=“line-cell item-price”]/text()’)

re = loader.get_xpath(‘div/span[@class=“line-cell item-price”]/text()’)
  # print(re)
  yield loader.load_item()

def in_price_processor(value):
  print(float(value[0][1:]))
  # print(value)
  # 删除¥符号,转换为float类型
  return float(value[0][1:])

def out_price_processor(value):
  print(value)
  # 删除¥符号,转换为float类型
  return value[0] + 100

class JobscrapyItem(scrapy.Item):
  # 培训公司名
  company_name = scrapy.Field()
  # 课程价格
  course_price = scrapy.Field(
  # input_processor=in_price_processor,
  # output_processor = out_price_processor
  )

# -----------------------重点关注这个全局函数的self参数
  def price_processor(self, value):
  print(self) # 输出的类型是CourseItemLoader
  print(float(value[0][1:]))
  # print(value)
  # 删除¥符号,转换为float类型
  return float(value[0][1:])

class CourseItemLoader(scrapy.loader.ItemLoader):
  course_price_in = price_processor # 这个函数被调用。
  # course_price_out = price_processor
  二、Python的接口编程实现技巧
  从上面代码可以得到一种类似抽象接口实现的编程技巧;尽管传统使用的是抛出实现异常机制,我觉得这种编程思路也不错(传统异常方式稳定性,逻辑性更加好点),可以减肥食谱:www.sheonline.cn实现类的定义与成员实现的分离,达到程序设计的低耦合实现,在此备忘一下代码。

class A:
  meth = None

def meth(self, param):
  print(param)

class B(A):
  meth = meth

b = B()
  b.meth(‘hello’)
 一看到“IT高手”这几个字,大家都会想到黑客,是的,黑客是IT高手,但IT高手并不一定是黑客。我心目中IT高手,是电脑技术特别是软件开发技术非常厉害的人,能开发非常优秀软件被大家使用的人。
  IT高手有两个技术方向。一个是嵌入式单片机开发方向;另一个是电脑上的软件开发方向,主要是Windows XP及以上版本操作系统中的软件开发。
  我们首先来说一下嵌入式单片机开发方向,以下是学习嵌入式单片机最佳过程:
  1. 《C语言程序设计》。这个是嵌入式单片机的软件基础。
  2. 《单片机基础》。这个是嵌入式单片机的硬件基础。以8位单片机中最典型的80C51单片机讲解,以汇编编程。
  3. 《单片机C语言程序设计》。这个是用C高级语言来开发单片机软件的方法,单片机C和《C语言程序设计》中内容大部分相同,只是其中一些与单片机硬件有关的编程不同,我们要学的也是这一部分。
  4. 《数据结构》C语言版和《算法基础》。这个是进一步灵活应用C/C++语言来开发高水平软件的基础,也是软件开发的灵魂。当然电脑上的软件开发也要用到它。
  5. 《32位单片机开发》。以上是8位单片机,所以要进一步深入学习就要学习32位单片机。主要学习32位单片机硬件特性。各种丰富的外设如屏,SD,蓝牙,网络,摄像头等开发。
  6.《linux操作系统》和《C++程序设计》。 进一步发挥32位以及64位单片机特性。搭建具有更加丰富的外设平台,以满足各种实际应用的需要。
  学完以上,差不多就是嵌入式单片机中的高手了,要想成为高手中的高手,只是多练习、多实践、多做项目、熟能生巧的过程了。
  接下来我们说一下电脑上的软件开发方向,以下是学习电脑端软件开发最佳过程:
  1. 《C语言程序设计》。这个是面向过程软件的基础。
  2. 《C++语言程序设计》。这个是面向对象软件的基础。
  3. 《数据结构》C语言版和《算法基础》。这个是进一步灵活应用C/C++语言来开发高水平软件的基础,也是软件开发的灵魂。
  4. 根据自已想从事工作的方向选一种高级语言和开发工具学习。
  VC++介绍: 硬件平台上位机开发,驱动开发,游戏开发,黑客技术等偏底层的软件开发,当然,其实它可以开发任何软件。
  JAVA介绍: 开发网络软件,且跨平台特性。其实它可以开发大多数软件。
  Delphi介绍:开发数据库软件,其实它可以开发大多数软件。
  PHP介绍: 是一种 HTML 内嵌式的语言,开发动态网页,站点等等。
  Python介绍: 是一种解释型脚本语言,可以应用于以下领域:
  Web 和 Internet开发,如网络爬虫等等;
  科学计算和统计。
  我重点讲一下VC++的学习方法:
  A. 第一步要学会WIN32项目和MFC类库的运行流程,也就是说知道自已要在那儿写代码或修改代码,达到自已想要的功能。
  这方面建议看《深入浅出MFC》 侯俊杰著,这是非常经典的书,看完你就知道软件是怎样运作的,你VC++就入门了。
  B. 第二步要根据自已工作方向,多买不同版本类似工作的书。且一定要买一本MFC类库手册,方便自已查阅类和函数。
  C. 第三步是多练习、多实践、多做项目、熟能生巧的过程了。
  D. 以上是学习VC++的方法。其它语言也一样,先要搞懂类库的运行流程,再就是结合工作方向学习具体相关知识,最后是多练习、多实践、多做项目就可以了。
  学完以上,差不多就是电脑端软件开发中的高手了,要想成为高手中的高手,只是多练习、多实践、多做项目、熟能生巧的过程了。
  看完上面的内容,大家可能觉得有好多内容啊!好难啊!是的,成为高手那有那么容易。但是只要学好C/C++语言程序设计,并在学习过程中培养自已高效的自学能力和创新精神,成为高手也是指日可待的。

基于遗传算法的新的异构分布式系统任务调度算法研究(Matlab代码实现)内容概要:本文档围绕基于遗传算法的异构分布式系统任务调度算法展开研究,重点介绍了一种结合遗传算法的新颖优化方法,并通过Matlab代码实现验证其在复杂调度问题中的有效性。文中还涵盖了多种智能优化算法在生产调度、经济调度、车间调度、无人机路径规划、微电网优化等领域的应用案例,展示了从理论建模到仿真实现的完整流程。此外,文档系统梳理了智能优化、机器学习、路径规划、电力系统管理等多个科研方向的技术体系与实际应用场景,强调“借力”工具与创新思维在科研中的重要性。; 适合人群:具备一定Matlab编程基础,从事智能优化、自动化、电力系统、控制工程等相关领域研究的研究生及科研人员,尤其适合正在开展调度优化、路径规划或算法改进类课题的研究者; 使用场景及目标:①学习遗传算法及其他智能优化算法(如粒子群、蜣螂优化、NSGA等)在任务调度中的设计与实现;②掌握Matlab/Simulink在科研仿真中的综合应用;③获取多领域(如微电网、无人机、车间调度)的算法复现与创新思路; 阅读建议:建议按目录顺序系统浏览,重点关注算法原理与代码实现的对应关系,结合提供的网盘资源下载完整代码进行调试与复现,同时注重从已有案例中提炼可迁移的科研方法与创新路径。
【微电网】【创新点】基于非支配排序的蜣螂优化算法NSDBO求解微电网多目标优化调度研究(Matlab代码实现)内容概要:本文提出了一种基于非支配排序的蜣螂优化算法(NSDBO),用于求解微电网多目标优化调度问题。该方法结合非支配排序机制,提升了传统蜣螂优化算法在处理多目标问题时的收敛性和分布性,有效解决了微电网调度中经济成本、碳排放、能源利用率等多个相互冲突目标的优化难题。研究构建了包含风、光、储能等多种分布式能源的微电网模型,并通过Matlab代码实现算法仿真,验证了NSDBO在寻找帕累托最优解集方面的优越性能,相较于其他多目标优化算法表现出更强的搜索能力和稳定性。; 适合人群:具备一定电力系统或优化算法基础,从事新能源、微电网、智能优化等相关领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①应用于微电网能量管理系统的多目标优化调度设计;②作为新型智能优化算法的研究与改进基础,用于解决复杂的多目标工程优化问题;③帮助理解非支配排序机制在进化算法中的集成方法及其在实际系统中的仿真实现。; 阅读建议:建议读者结合Matlab代码深入理解算法实现细节,重点关注非支配排序、拥挤度计算和蜣螂行为模拟的结合方式,并可通过替换目标函数或系统参数进行扩展实验,以掌握算法的适应性与调参技巧。
本项目是一个以经典51系列单片机——STC89C52为核心,设计实现的一款高性价比数字频率计。它集成了信号输入处理、频率测量及直观显示的功能,专为电子爱好者、学生及工程师设计,旨在提供一种简单高效的频率测量解决方案。 系统组成 核心控制器:STC89C52单片机,负责整体的运算和控制。 信号输入:兼容多种波形(如正弦波、三角波、方波)的输入接口。 整形电路:采用74HC14施密特触发器,确保输入信号的稳定性和精确性。 分频电路:利用74HC390双十进制计数器/分频器,帮助进行频率的准确测量。 显示模块:LCD1602液晶显示屏,清晰展示当前测量的频率值(单位:Hz)。 电源:支持标准电源输入,保证系统的稳定运行。 功能特点 宽频率测量范围:1Hz至12MHz,覆盖了从低频到高频的广泛需求。 高灵敏度:能够识别并测量幅度小至1Vpp的信号,适合各类微弱信号的频率测试。 直观显示:通过LCD1602液晶屏实时显示频率值,最多显示8位数字,便于读取。 扩展性设计:基础版本提供了丰富的可能性,用户可根据需要添加更多功能,如数据记录、报警提示等。 资源包含 原理图:详细的电路连接示意图,帮助快速理解系统架构。 PCB设计文件:用于制作电路板。 单片机程序源码:用C语言编写,适用于Keil等开发环境。 使用说明:指导如何搭建系统,以及基本的操作方法。 设计报告:分析设计思路,性能评估和技术细节。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值