用火狐批量下载某个页面的所有文件

本文介绍了如何使用火狐浏览器的DownThemAll插件批量下载网页上的所有文件,特别是对于链接数量庞大且具有特定规律的情况。通过识别URL模式,自动生成所有需要下载的文件链接,并将生成的链接列表导入DownThemAll,实现快速批量下载,避免手动操作的繁琐和等待时间。

为了批量下载某个页面的数据,类似这样:

https://mirador.gsfc.nasa.gov/cgi-bin/mirador/presentNavigation.pl?tree=project&dataset=TRMM_3B42_Daily.7&project=TRMM&dataGroup=Gridded&version=7&CGISESSID=84e0955d8c4747aff25f1c35a58e38d0

因为链接太多,不可能一个个手点,如果遇到外网那更坑爹,一个窗口等10秒,小米手机都凉了,这样肯定需要批量下载,我亲测的有两个方法可行。

一个是我一开始查到的方法,安装了迅雷之后,可以在当前要下载的页面的链接上点右键,注意不是在页面空白处,而是它的url上


然后选择用迅雷下载所有链接,但是这个方法对这次的例子并不可用,实际上下下来的全是网页的配置文件。

第二个方法是利用火狐浏览器的downthemall插件进行批量下载。插件的安装地址见此:

https://addons.mozilla.org/en-US/firefox/addon/downthemall/

注意这是火狐的插件,一定要用火狐的浏览器才能实现。

首先,根据要下的文件的链接网址规律生成所有的网址,比如通过两个不相邻的文件下载地址找出规律:

http://disc2.gesdisc.eosdis.nasa.gov/data//TRMM_L3/TRMM_3B42_Daily.7/2015/01/3B42_Daily.20150108.7.nc4
http://disc2.gesdisc.eosdis.nasa.gov/data//TRMM_L3/TRMM_3B42_Daily.7/2016/06/3B42_Daily.20160629.7.nc4

可以发现只有在年月日的数字上有变化,而且是与实际日期相匹配的,于是我们简单的编程实现所有网址的输出,具体程序就不放了,总体就是打开txt文件,然后在for循环的控制下写入规格化的字符串,某几处要改的年月日的值是用for来控制的。如果用python输出2013年11,12月的1-9号的网址,类似如下(新手写的很蠢,不要嘲笑):

f=open(r'C:/new.txt','w')

for y in (11,12):
    for z in (1,10):
        f.write('http://disc2.gesdisc.eosdis.nasa.gov/data//TRMM_L3/TRMM_3B42_Daily.7/'+str(x)+'/'+str(y)+'/3B42_Daily.'+str(x)+str(y)+'0'+str(z)+'.7.nc4\n')
f.close()

执行后就会输出new文档,直接把该txt文档拖到火狐浏览器的标题栏位置,火狐就会跳出显示txt里所有内容的界面:


右键之后选择DownThemAll,就可以自动下载所有该文件里的链接:


完成!前提是必须自己生成网址,我没有尝试找更简单的方法,但是排除编程输出所有网址的过程,总体还是很简单的。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值