国家网络存档的设计与选择标准
1. 顶级域名与存档选择
顶级域名(TLD)主要分为通用顶级域名(gTLDs)和国家代码顶级域名(ccTLDs)。gTLDs 供特定类型的组织使用,由全球多个机构管理,例如 .COM 用于商业组织。ccTLDs 则委托给指定的管理者,他们根据当地政策运营,以适应国家的经济、文化、语言和法律环境。因此,使用 ccTLD 的网站是网络存档的有力候选对象。然而,这种方法会排除托管在 ccTLD 之外但与该国相关的文档。以葡萄牙网络为例,有 49% 的文档托管在 .PT 顶级域名之外。
2. 博客排除情况
博客是在网络上频繁按时间顺序发布个人想法的平台。尽管博客数量在增加,但大多数很少被访问且很快被抛弃。调查显示,典型的博客是由十几岁的女孩撰写,每月使用两次来向朋友和同学更新生活。不过,博客也可用于轻松发布和讨论任何主题,相较于传统网站更受欢迎。那些描述不同年龄、阶层和文化的公民生活的博客,将是描述我们这个时代的极有价值的资源。
若将网站名称中包含“blog”的视为博客,我们发现如果不存档博客,基线中的 15.5% 的文档将被排除在国家网络存档之外。其中,67% 的博客文档托管在 .com 域名下,33% 托管在 .PT 域名下的博客中。这是因为大多数流行的博客网站托管在 .COM 域名下,这会增加国家网络中托管在国家代码顶级域名之外的文档数量。
3. 网络服务器的物理位置
RIPE 网络管理数据库提供了 IP 地址首次分配或指定的国家。我们可能会认为一个国家的网络由物理上位于该国的服务器上托管的文档组成,但实际上,葡萄牙网络基线中只有 39.4% 的 IP 地址分配给了葡萄牙。
超级会员免费看
订阅专栏 解锁全文

2222

被折叠的 条评论
为什么被折叠?



