Internet Archive:10PB的数据看起来像什么?

InternetArchive(网站时光倒流机WaybackMachine)定期收录并永久保存全球网站信息。本文介绍了其背后的数据存储原理及规模,包含10PB的数据量,涵盖了网站、书籍、电影等多种类型的内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

日期:2013-5-31  来源:GBin1.com

Internet Archive:10PB的数据看起来像什么?

Internet Archive(互联网档案),也称作“网站时光倒流机”Wayback Machine,定期收录并永久保存全球网站上可以抓取的信息。对网站不同时期的历史资料进行研究,是互联网档案最大的价值。

网站时光倒流机Wayback Machine看上去很简单 - 不过是一个安装在网站上的插件,并且随时间推移,你可以看到它的副本。

但 是你只是看到了它简单的表面,并没有看到它为了维护这些档案,保存副本所必须的超大数量数据以及存储。导演Jonathan Minard的纪录片Internet Archive记录了在幕后是它如何(以及为何)努力的维护着我们如今看到的Internet Archive。

纪录片采访了Internet Archive的奠基者Brewster Kahle,讲述了关于档案背后的主意,以及让我们看到了存储了10PB数据的服务器,这些数据包括当前Internet Archive上存储的网站,书籍,电影,音乐以及电视广播的存档。

想要了解更多Internet Archive,请登陆Vimeo,观看更多视频介绍。

via Nelly@极客社区

来源:Internet Archive:10PB的数据看起来像什么?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值