linux wget 命令_我如何使用wget Linux命令恢复丢失的图像

linux wget 命令

2004年,开放剪贴画库(OCAL)成为免费插图的来源,任何人都可以出于任何目的使用它们,而无需注明出处或提供任何回报。 这个站点是开放源代码世界对1990年代每个家庭办公室书架上的大量剪贴CD以及封闭源办公室提供的艺术品转储和艺术品软件的答复。

最初,剪贴画库主要由少数贡献者完成,但在2010年,它与一个全新的交互式网站一起上线,允许任何人使用矢量图应用程序创建和贡献剪贴画。 该站点立即获得了来自全球,各种形式的自由软件和自由文化项目的贡献。 Inkscape中甚至包括该库的特殊导入器。

但是,在2019年初,托管Open Clip Art Library的网站离线,没有任何警告或解释。 它的社区已经发展到成千上万的人数,起初以为这是暂时的故障。 但是,该网站保持离线状态已超过六个月,没有任何清楚的解释。

谣言开始膨胀。 该网站正在更新中(“要偿还数年的技术债务,”网站开发商Jon Philips在一封电子邮件中说)。 Twitter帐户声称,该网站已遭受猖D的DDOS攻击。 另一个Twitter帐户声称,维护者已经成为身份盗窃的牺牲品。 今天,在撰写本文时,该站点的一个且唯一的页面声明它处于“维护和保护模式”,其含义不清楚,只是用户无法访问其内容。

恢复公地

站点会随着时间的流逝而消失,但是丢失开放剪贴画库对其社区而言尤其令人惊讶,因为它被视为社区项目。 很少有社区成员理解托管该库的站点已落入单个维护者的手中,因此,由于其Creative Commons 0许可证 ,每个人都拥有该库中的艺术品, 但从功能上来说,访问权归单个维护者所有。 而且,由于站点的社区通过站点彼此保持联系,因此该维护者实际上拥有该社区。

当站点出现故障时,社区以及彼此之间都无法访问其艺术品。 没有该站点,就没有社区。

最初,该站点发生故障时,所有内容均被阻止。 但是,几个月后,用户开始意识到该站点的数据库仍处于联机状态,这意味着用户可以通过输入其确切的URL访问单个艺术文件。 换句话说,您无法通过在网站上单击来导航至艺术品文件,但是如果您已经知道该地址,则可以在浏览器中显示它。 类似地,技术(或懒惰)用户意识到也可以使用诸如wget之类的自动化Web浏览器来“抓取”该站点。

技术上讲wget Linux命令是Web浏览器,尽管它不允许您像使用Firefox那样进行交互式浏览。 而是wget上网,检索文件或文件集合,然后将它们下载到硬盘上。 然后,您可以在Firefox或文本编辑器或最合适的应用程序中打开这些文件,然后查看内容。

通常, wget需要知道要提取的特定文件。 如果您使用的是Linux或安装了wget的 macOS,则可以通过下载example.com的索引页面来尝试此过程:


   
   
$ wget example.org / index.html
[ ... ]
$ tail index.html

< body >< div >
    < h1 > Example Domain </ h1 >
    < p > This domain is for illustrative examples in documents.
    You may use this domain in examples without permission. </ p >
        < p >< a href = "http://www.iana.org/domains/example" > More info </ a ></ p >
</ div ></ body ></ html >

为了抓取Open Clip Art库,我使用了--mirror选项,以便可以将wget指向仅包含艺术品的目录,以便可以下载该目录中的所有内容。 此操作导致连续四天(96个小时)持续下载,最终超过50000个社区成员贡献了100,000个SVG文件。 不幸的是,任何没有适当元数据的文件的作者都是无法恢复的,因为此信息被锁定在数据库中不可访问的文件中,但是CC0许可证从技术上讲并不重要(因为CC0文件不需要属性) 。

对下载文件的随意分析还显示,其中有近45,000是同一文件(网站徽标)的副本。 这是由于指向网站徽标的重定向(原因未知)引起的,仔细分析可能会提取原始目标。 又过了96个小时,OCAL直到最后一天发布的所有剪贴画都被恢复: 总共约有156,000张图像。

SVG文件通常很小,但是这仍然是大量工作,带来了一些非常实际的问题。 首先,将需要数GB的在线存储空间,这样艺术品才能供其先前的社区使用。 其次,将需要一种搜索​​艺术品的方法,因为手动浏览55,000个文件是不现实的。

很明显,社区真正需要的是一个平台。

建立一个新平台

一段时间以来,“ 公共领域矢量 ”站点一直在发布公共领域的矢量艺术。 虽然它仍然是一个受欢迎的网站,但是开放源代码用户经常将其仅用作辅助艺术资源,因为其中大多数文件都是EPS和AI格式的,两者均与Adobe相关联。 两种文件格式通常都可以转换为SVG,但是功能有所损失。

当Public Domain Vectors网站的维护者(Vedran和Boris)得知Open Clip Art库的丢失时,他们决定创建一个面向开源社区的网站。 确实如此,他们选择了开源Laravel框架作为后端,该框架为网站提供了管理控制台和用户访问权限。 该框架功能强大且开发完善,还使他们能够快速响应错误报告和功能请求,并根据需要升级站点。 他们正在建立的站点称为FreeSVG.org ,已经是一个强大而繁荣的公共艺术品图书馆。

从那时起,他们一直在从Open Clip Art Library上传所有剪贴画,并且他们甚至在努力地对艺术品进行标记和分类。 作为Public Domain Vectors的创建者,他们还以SVG格式贡献自己的图像。 他们的目标是成为Internet上具有CC0许可证的SVG图像的主要资源。

贡献

FreeSVG.org的维护者知道他们已经继承了重要的管理权。 他们正在努力对网站上的所有图像进行标题和描述,以便用户可以轻松找到艺术品,并在准备就绪后将其提供给社区,并坚信与艺术品有关的元数据属于创建和使用艺术品的人。艺术与艺术本身一样多。 他们还意识到可能会出现无法预料的情况,因此他们会定期为其网站和内容创建备份,并打算在站点发生故障时向公众提供最新备份。

如果要添加到FreeSVG.org的知识共享内容, 下载Inkscape并开始绘制。 世界上有很多公共领域的艺术品,例如历史广告塔罗牌故事书,它们正等待转换为SVG,因此即使您对绘画技巧不自信,您也可以做出贡献。 访问FreeSVG论坛 ,与其他贡献者联系并支持他们。

公地的概念很重要。 不论您是学生,老师,图书馆员,小型企业主还是首席执行官, 知识共享都将使所有人受益 。 如果您不直接捐款,那么您随时可以帮助推广。

这是自由文化的力量:它不仅可以扩展,而且随着更多人的参与,它会变得更好。

艰难的教训

从开放剪贴画库的消亡到FreeSVG.org的兴起,开放文化社区已经吸取了一些艰辛的经验。 对于后代,以下是我认为最重要的那些。

维护您的元数据

如果您是内容创建者,请帮助将来的档案管理员并将元数据添加到文件中。 大多数图像,音乐,字体和视频文件格式都可以嵌入EXIF数据,而其他文件,格式,视频文件格式可以在创建它们的应用程序中具有元数据输入界面。 勤于用您的姓名,网站或公共电子邮件以及许可证来标记您的作品。

复印

不要以为别人在做备份。 如果您关心公用数字内容,请自己备份,否则不要指望永远提供它。 永远上传到互联网的说法也许是正确的,但这并不意味着它永远可供您使用 。 如果“开放剪贴画库”文件没有再次秘密可用,那么任何人都不太可能成功地从网络上的随机位置或从全球人们的硬盘上的私人藏匿处成功发现所有55,000张图像。

创建外部渠道

如果一个社区是由单个网站或实际位置定义的,则该社区如果失去对那个空间的访问权限,则与解散状态一样好。 如果您是由单个组织或站点驱动的社区的成员,则应该自己与关心的对象共享联系信息,并即使在该站点不可用时也可以建立沟通渠道。

例如, Opensource.com本身会维护其作者和通讯者的邮件列表和其他异地渠道,以在有或没有网站干预或什至没有网站干预的情况下相互交流。

自由文化值得努力

互联网有时被视为懒人的社交俱乐部。 您可以在需要时登录,并在感到疲倦时将其关闭,并且可以漫步到所需的任何社交圈。

但实际上,自由文化可能是艰苦的工作。 从某种意义上说,要成为其中的一部分很困难,这并不难,但这是您必须维护的工作。 如果您忽略了所处的社区,那么社区可能会在您意识到之前逐渐枯萎和衰落。

花点时间环顾四周,确定您属于哪个社区,如果没有其他任何事情,请告诉某人您对他们带给您生活的一切表示赞赏。 同样重要的是,请记住,您也为社区的生活做出了贡献。

翻译自: https://opensource.com/article/19/10/how-community-saved-artwork-creative-commons

linux wget 命令

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值