【phpcms v9】自带采集功能说明

本文详细介绍网站数据采集的五个关键步骤,包括采集点设置、内页采集配置、测试、内容发布及历史记录管理,助您高效完成网站数据抓取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

步骤一、采集点设置:例如我们要采集的目标网址是http://www.abcd.com

1、填写目标网址的编码

2、填写目标网址

3、列表页面必须选择该列表的父标签,尽可能缩小范围,不要带多级标签比如<div><ul>.....

 

步骤二、内页采集设置

标题、内容都需要设置,如果需要同步采集文章发布时间和指定缩略图,也需要在这个时候先设置好。

我再翻新网站时可以自己先修改好缩略图的路径,用“来源规则”直接获取路径,等到采集完后导入新网站栏目时修改缩略图对应的规则为“来源”即可。

步骤三、设置好后点击测试,出现列表就可以开始采集了

步骤四、在采集管理页面,依次点击 [采集网址] [采集内容] [内容发布]    ,最后一个内容发布时是开始导入文章。这时候如果你设置过时间规则、来源规则等要注意查看导入时的对象是否符合。

步骤五、导入后采集管理页面的历史记录可以删除,不影响已经导入的文章。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值