火车头文章采集步骤研究--如何导入本地access数据库

本文详细介绍了如何使用火车头采集软件创建任务,分析网页规则,并将数据存储到本地Access数据库的过程,包括首页与内页的采集规则、标题和内容的截取、分页识别以及数据库发布配置等步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

       最近一直在研究一个叫火车头的采集软件,现在终于有点眉目了,不过我的发布重点是在介绍怎么存储到本地access数据库上的,其他的我目前不需要也就暂时没去研究了,那么具体步骤是怎样的呢,让我们接着往下走~~~

1、为了方便管理,我们先建立测试站点,点击新建右边的小三角-->分组,先建立一个分组,再在分组下面建立测试的任务

 

2、接下来开始建立采集的任务,还是点击新建右边的小三角-->任务,打开新建任务对话框,如下图所示:


                                      图1

这个就是任务的界面,好了,那么这边我就拿http://www.lawtime.cn/info/fangdichan/fcanli/这个做范例,因为首页和内页的规则是不一样的哦。因此,如下

2-1、第一步的采集网址规则,这边就是要把文章的地址先采集下来,所以我们分析了下页面发现要先分首页和内页问题。。所以我们先点击添加按钮如下:

                                      图2

这个就是首页的地址,我们单独分开先添加一条单页地址采集规则。

 

2-2、然后重复上面的步骤,但是我们在添加采集地址的时候要选择击“批量/多页”命令,具体如下:

                                    图3

 

好了我们已经分析好网址了,接下来就是截取文章的地址列表,,具体下面:

                                      图4

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值