采集XML,RSS,TXT等特殊网页的数据

简数采集器支持一键采集XML、RSS、TXT等特殊网页的数据。在采集器中打开采集任务的列表提取器配置,选择“特殊网页(如xml、txt等用正则获取链接)”,系统会自动获取页面网址链接,点击保存完成配置。若遇采集不到网址的列表页,该功能可解决。

简数采集器支持一键采集XML,RSS,TXT等特殊网页的数据,十分简单快速。

打开简数采集任务的列表提取器配置,然后选择 “特殊网页(如xml、txt等用正则获取链接)” ,系统会切换为正则获取链接模式,自动获取页面中的全部网址链接,点击右上角保存按钮完成配置。

注意:“提取链接正则” 处一般不用修改,默认填写获取网址链接的正则表达式。

1. 采集TXT网页数据

2. 采集XML网页数据

3.采集RSS网页数据

如果遇到采集不到网址的列表页,可以尝试 “特殊网页(如xml、txt等用正则获取链接)” 来解决,该功能基本可以获取 90% 页面中的文章网址!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值