火车头采集器 页面图片等信息采集
有些采集的页面中有图片或者其他内容如链接的word文档等等,如果采集下来,并保持链接呢。
火车头采集器中给了较好的操作。
在内容采集中,选择内容下载,如果仅仅是图片,勾选下载图片即可,还可以过滤页面中的垃圾信息,只选择页面中部分图片进行下载。
此地请注意。一定要在总步骤的第四步中保存文档位置选择保存路径,否则鬼知道下载到哪里去了(它提示你正常下载,可是给出的路径找不到链接)
2016.5.18补充
如果需要把图片镶嵌在网页原位置,需要做到,一图片和网页保存在相对一致的同文件夹内,二文件命名是以标签标题和原文件名命名
再次向火车头采集的开发者表示感谢!