Python学习笔记(18)数据采集、爬虫路线、连续动作三者的执行顺序

本文介绍了Python爬虫中数据采集、爬虫路线和连续动作的基本概念及其执行顺序。数据采集定义抓取内容,爬虫路线包括下级线索等,连续动作涵盖多种动作类型。执行顺序通常为:数据采集 -> 连续动作 -> 爬虫路线。当规则同时包含连续动作和翻页线索时,DS会先采集数据,执行连续动作,然后执行翻页线索。对于连续动作内部,步骤按定义顺序执行,可通过排序窗口调整步骤顺序。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、基本概念

1.1,数据采集

数据采集指的是我们在“创建规则”工作台定义的抓取内容。

1.2,爬虫路线

爬虫路线指的是在“爬虫路线”工作台定义的线索,包括下级线索、翻页线索和一次性的模拟点击等。

1.3,连续动作

连续动作指的是在“连续动作”工作台定义的线索,包括悬浮、点击、滚屏、选择等多种动作类型。

二、执行顺序

总体上,爬虫先进行数据采集,再执行爬虫路线或连续动作。如果一个规则里既有连续动作又有爬虫路线,那么爬虫会先执行连续动作再执行爬虫路线。

2.1,数据采集+爬虫路线(下级线索)

同一个规则的数据采集和爬虫路线的下级线索没有先后之分,下级线索只是在数据采集过程中把当前页面的链接保存起来࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值