python--小总结,scrapy框架

python基础必会:

      常用的数据类型:

             tuple 

             list 

             set 

             dict 

             range 

             str 

             分片 [::] 

             推倒

     函数:
         def 函数名(参数)
                  实现函数体
     难点:

             参数的种类:

              必须参数:必填的参数
              默认参数:参数
              关键参数:通过参数名称等约名称
              可变参数:tuple:*参数名称   dict:**kwargs


              建议:默认参数一定要在必须参数之后定义,可变参数一定要定义在最后
                    tuple的可变参数要在字典的可变参数之前
     函数的种类:
              内部函数:
              外部函数:
              匿名函数:lambda
              用户自定义函数:
     装饰函数:
            @

            函数总是要返回,如果没有return  None 总是被返回  

 面向对象:

          对象:已存在可被使用的实例  万物皆对象  函数 模块 变量  类  方法  都是对象
          class: 描述其他实例信息的对象
          属性: 定义其他实例特征的对象
          方法: 定义其他实例行为的对象
                      与函数的区别:
                          函数可独立定义和调用
                          方法不能独立定义也不能独立调用
           staticmethod:
           classmedthod:

          例:
          stu = Student()
          stu.jump=lambda x:print("你跳了{0}米".format(x))

          stu.jump(1.2) 

  常用模块:

             re  正则
             xml....  解析
             time  时间模块
             socket
             threading  线程
             random  随机数
             pickle  序列化
             os
             sys
    

scrapy执行流程:

    引擎从调度器中取出一个链接(URL)用于接下来的抓取------>引擎把URL封装成一个请求(Request)传给下载器------> 下载器把资源下 载下来,并封装成应答包(Response)-----> 爬虫解析Response------->解析出实体(Item),则交给实体管道进行进一步的处理-----> 解析出的是链接(URL),则把URL交给调度器等待抓取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值