wget网站镜像下载

1、镜像方式下载整个网站

#wget -m http://www.example.com/

如果发现Not following http://www.example/a/ because robots.txt forbids it.Decided NOT to load it.

原来是robots.txt协议要求的,对于这种君子协议

#wget -m -e robots=off http://www.example.com/

另外有些网站也会禁止wget之类agent下载,我们也可以伪装一下,下面是一个比较完美的镜像大杀器语句:

#wget -m -e robots=off -U "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6″ "http://www.example.com/"

以上这种对url rewrite的网站是无用的。

2、下载目录

#wget -r -np -nd http://example.com/packages/

3、下载指定扩展名文件

#wget -r -np -nd --accept=iso http://example.com/centos-5/i386/

api

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值