火车头采集器 页面图片等信息采集

本文介绍如何使用火车头采集器高效地采集页面中的图片和其他文档内容,包括设置下载选项、过滤垃圾信息、确保图片正确显示的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

火车头采集器 页面图片等信息采集

有些采集的页面中有图片或者其他内容如链接的word文档等等,如果采集下来,并保持链接呢。

火车头采集器中给了较好的操作。

在内容采集中,选择内容下载,如果仅仅是图片,勾选下载图片即可,还可以过滤页面中的垃圾信息,只选择页面中部分图片进行下载。

此地请注意。一定要在总步骤的第四步中保存文档位置选择保存路径,否则鬼知道下载到哪里去了(它提示你正常下载,可是给出的路径找不到链接)

2016.5.18补充

如果需要把图片镶嵌在网页原位置,需要做到,一图片和网页保存在相对一致的同文件夹内,二文件命名是以标签标题和原文件名命名 

再次向火车头采集的开发者表示感谢!

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值