python3总结和spider爬虫

最新推荐文章于 2025-06-24 14:56:29 发布

MIGENGKING

最新推荐文章于 2025-06-24 14:56:29 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/MIGENGKING/article/details/89435987

这篇博客总结了Python3的基础知识，包括操作符、循环、函数、对象、模块、数据结构以及文件操作。还介绍了如何入门爬虫，涉及Burp Suite的代理设置和Scrapy项目的创建。通过实例讲解了如何定义Item、编写爬虫以及start_urls和parse方法的使用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这段时间学习了Python3的一些基础内容

Python简单操作符
+ - （加、减）
= （等于）
// （所谓“地板除(法)”） ==>既是：整数除以整数
% （求余）* （乘法）** （幂运算）

Python的循环

   for循环

    while循环

Python的函数，对象，模块
列表
元组
字典

Python文件
读
写
保存
修改
通过学习python的一些基础内容，了解了一些Python的基本用法，可以简单的去用Python来去让电脑计算一些我们人要求的算法或文件。通过循环我们可以让计算机短时间计算一些超级大数而且是可以连续不断的运算；通过函数，对象及模块我们可以与计算机进行人机交流，可以让计算机计算或生成我们人类想要表达的愿望或想法，可以让计算机存储成倍且不易丢失的数据或内容。通过文件我们可以让计算机做成一个我们想要的软件，或是通过。

三、爬虫入门

四使用spider爬虫过程：

1 在安装好Java和burpsuite的前提下，并在相关浏览器上设置好相关代理。接下来打开burpsuite，如图：

在这里插入图片描述

2然后我们就可以在地址栏输入我们要进行的网址并回车，此时我们再打开Burp Suite，选择Proxy我们就可以看到已经开始建立代理监听，我们此时鼠标右键选择第一个Send to Spider开始进行爬虫，

在这里插入图片描述
3我们点击Spider可以看到已经开始进行了

在这里插入图片描述

4我们也可以按Target查看。

在这里插入图片描述

爬虫二

创建一个Scrapy项目

一般我建议在学习或者工作目录下单独建立一个目录来存放某一个特定学习项目或者文档（建议而已），直接上命令

scrapy startproject first_spider
#命令串解释：命令创建新项目的动作项目名称（随便起）

建立好之后我们会看到项目结构如下（划掉的部分为后面写的爬虫文件以及爬虫爬取到的文件，初始没有的）

在这里插入图片描述

目录中部分函数的作用

scrapy.cfg: 项目的配置文件
first_spider/: 该项目的python模块。之后您将在此加入代码。
first_spider/items.py: 项目中的item文件.
first_spider/pipelines.py: 项目中的pipelines文件.
first_spider/settings.py: 项目的设置文件.