步骤一、采集点设置:例如我们要采集的目标网址是http://www.abcd.com
1、填写目标网址的编码
2、填写目标网址
3、列表页面必须选择该列表的父标签,尽可能缩小范围,不要带多级标签比如<div><ul>.....
步骤二、内页采集设置
标题、内容都需要设置,如果需要同步采集文章发布时间和指定缩略图,也需要在这个时候先设置好。
我再翻新网站时可以自己先修改好缩略图的路径,用“来源规则”直接获取路径,等到采集完后导入新网站栏目时修改缩略图对应的规则为“来源”即可。
步骤三、设置好后点击测试,出现列表就可以开始采集了
步骤四、在采集管理页面,依次点击 [采集网址] [采集内容] [内容发布] ,最后一个内容发布时是开始导入文章。这时候如果你设置过时间规则、来源规则等要注意查看导入时的对象是否符合。
步骤五、导入后采集管理页面的历史记录可以删除,不影响已经导入的文章。