wget下载网站的目录

本文深入解析wget命令的关键参数及其使用场景,包括断点续传、递归下载、目录处理、链接转换等功能,并通过具体实例展示如何高效下载特定目录下的文件。
$ wget -c -r -nd -np -k -L -p -A c,h www.xxx.org/pub/path/

-c  断点续传
-r  递归下载,下载指定网页某一目录下(包括子目录)的所有文件
-nd 递归下载时不创建一层一层的目录,把所有的文件下载到当前目录
-np 递归下载时不搜索上层目录,如wget -c -r www.xxx.org/pub/path/
    没有加参数-np,就会同时下载path的上一级目录pub下的其它文件
-k  将绝对链接转为相对链接,下载整个站点后脱机浏览网页,最好加上这个参数
-L  递归时不进入其它主机,如wget -c -r www.xxx.org/ 如果网站内有一个这样的链接:
    www.yyy.org,不加参数-L,就会像大火烧山一样,会递归下载www.yyy.org网站
-p  下载网页所需的所有文件,如图片等
-A  指定要下载的文件样式列表,多个样式用逗号分隔

实例:
wget -c -r -np -L /var/www/html/cm5.5.1 archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.5.1/
下载后 /var/www/html/cm5.5.1/archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.5.1/ 下是我要的文件
要使用 `wget` 下载整个目录的内容,可以通过递归下载功能实现。`wget` 提供了 `-r`(或 `--recursive`)选项,用于递归地下载远程服务器上的目录内容[^1]。该功能允许用户下载整个网站或特定目录下的所有文件,包括嵌套子目录和文件。 ### 下载整个目录的命令示例 以下是一个典型的命令,用于下载整个远程目录及其子目录中的所有文件: ```bash wget -r http://example.com/directory/ ``` 此命令会递归下载 `http://example.com/directory/` 下的所有内容,并保留原始目录结构。 ### 优化递归下载的参数 为了更好地控制下载行为,可以结合以下常用参数: - `-np`(或 `--no-parent`):不向上层目录递归,确保只下载指定目录下的内容。 - `-nH`(或 `--no-host-directories`):禁用以主机名命名的目录结构。 - `--cut-dirs=n`:忽略远程路径中的前 `n` 层目录。 - `-P`:指定本地保存下载内容的根目录。 例如,下载 `http://example.com/directory/` 并保存到本地 `~/downloads/` 目录中,忽略前两层目录: ```bash wget -r -np -nH --cut-dirs=2 -P ~/downloads/ http://example.com/directory/ ``` ### 限制下载范围 若希望仅下载特定类型的文件,可使用 `-A` 参数指定文件扩展名。例如,仅下载 `.pdf` 文件: ```bash wget -r -A.pdf http://example.com/directory/ ``` ### 避免服务器过载 为防止因大量请求导致服务器过载,建议使用 `-w` 参数设置下载间隔时间。例如,每次请求之间等待 2 秒: ```bash wget -r -w 2 http://example.com/directory/ ``` ### 静默下载 若希望减少输出信息,可以使用 `-q` 参数进行静默下载: ```bash wget -r -q http://example.com/directory/ ``` 通过上述命令和参数组合,可灵活地实现 `wget` 下载整个目录的需求。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值