wget very cool!!!

本文介绍了如何使用wget工具进行网站镜像备份的方法,包括设置请求间隔、获取所有页面元素及转换链接等功能,并对比了rsync工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

wget不仅能抓取某个页面,还能对网站做镜像,貌似很不错。这个不就是爬虫吗?而且速度也很快,用来抓取网页格式的文档是不错的。

 

让我们看这条命令:

wget --mirror –w 2 –p --HTML-extension –-convert-links –P ~\wget_files\example1 http://www.yourdomain.com 
  •  --mirror(-m):指定要做镜像的网站。wget会获取网站的所有链接和相关的文件。如果本地镜像存在,还会自动覆盖最近的更新。
  • -w:告诉wget每个请求的间隔时间,这里是2秒。这个不是必需的,当有些站点对请求间隔有限制时,这个参数就非常有用了。
  • -p:让wget获取页面上的所有元素,使其能在本地浏览。--mirror参数并不会保证所有的图片及相关文件都被下载,所以需要加上-p来指定。
  • --HTML-extension:将所有不是html扩展名的文件都转换成.html。这个参数会把CGI,ASP,PHP等结尾的文件都转换成html结尾。
  • -P(prefix folder):指定目标文件夹。

还可以备份ftp:

wget –mirror –w 3 –p –P ~\wget_files\example2 ftp://username:password@ftp.yourdomain.com

 

当然下载文件更没问题了:

Wget –P c:\wget_files\example3 http://ftp.gnu.org/gnu/wget/wget-1.9.tar.gz 

 

不过备份站点的话,可能用rsync更好的一点吧。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值