Ubuntu18.04下实现网上批量下载后缀名为pdb.gz的文件

本文详细介绍如何使用wget命令从PDBTM数据库下载特定格式的蛋白质结构数据,并提供了详细的参数说明及实例。此外,还列出了几个参考资料链接供进一步学习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【注:笔记于2019年10月31日记录在OneNote里的,现在把它们迁移到优快云里。】

PDBTM的网址:http://pdbtm.enzim.hu/data/database/

下载目录中 能够使用通配符匹配的文件命令如下:

wget -c  -r  -np  -k   -L  -p  -A '*.pdb.gz'  http://pdbtm.enzim.hu/data/database/

wget -c -r -np -k -L -p -A '*.pdb.gz'  http://pdbtm.enzim.hu/data/database/

参数解释:

-c    断点续传

-r    递归下载,下载指定网页某一目录下(包括子目录)的所有文件

-nd  递归下载时不创建一层一层的目录,把所有的文件下载到当前目录

-np  递归下载时不搜索上层目录,如wget -c -r http://pdbtm.enzim.hu/data/database/  没有加参数-np,就会同时下载path的上一级目录database下的其它文件

-k    将绝对链接转为相对链接,下载整个站点后脱机浏览网页,最好加上这个参数

-L    递归时不进入其它主机,如wget -c -r http://pdbtm.enzim.hu/data/database/

 

如果网站内有一个这样的链接: http://pdbtm.enzim.hu/data/database/  

不加参数-L,就会像大火烧山一样,会递归下载 http://pdbtm.enzim.hu/data/database/ 网站所有文件

-p   下载网页所需的所有文件,如图片等

-A   指定要下载的文件样式列表,多个样式用逗号分隔

-i    后面跟一个文件,文件内指明要下载的URL

# ==============================================================

参考网址:       <https://blog.youkuaiyun.com/Hesy_H/article/details/88905180>              

                         <https://blog.youkuaiyun.com/qq_35793285/article/details/89879693>

                         <https://blog.youkuaiyun.com/hbuxiaofei/article/details/87917506>

                         <https://blog.youkuaiyun.com/yinhuaiya/article/details/78675605>

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值