26、国家网络存档的设计与选择标准

最新推荐文章于 2025-11-13 10:00:00 发布

肥宅快乐水901

最新推荐文章于 2025-11-13 10:00:00 发布

阅读量521

点赞数

CC 4.0 BY-SA版权

分类专栏：数字图书馆的未来之路文章标签：国家网络存档顶级域名博客排除

本文链接：https://blog.youkuaiyun.com/websocket5live/article/details/154553664

数字图书馆的未来之路专栏收录该内容

69 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

国家网络存档的设计与选择标准

1. 顶级域名与存档选择

顶级域名（TLD）主要分为通用顶级域名（gTLDs）和国家代码顶级域名（ccTLDs）。gTLDs 供特定类型的组织使用，由全球多个机构管理，例如 .COM 用于商业组织。ccTLDs 则委托给指定的管理者，他们根据当地政策运营，以适应国家的经济、文化、语言和法律环境。因此，使用 ccTLD 的网站是网络存档的有力候选对象。然而，这种方法会排除托管在 ccTLD 之外但与该国相关的文档。以葡萄牙网络为例，有 49% 的文档托管在 .PT 顶级域名之外。

2. 博客排除情况

博客是在网络上频繁按时间顺序发布个人想法的平台。尽管博客数量在增加，但大多数很少被访问且很快被抛弃。调查显示，典型的博客是由十几岁的女孩撰写，每月使用两次来向朋友和同学更新生活。不过，博客也可用于轻松发布和讨论任何主题，相较于传统网站更受欢迎。那些描述不同年龄、阶层和文化的公民生活的博客，将是描述我们这个时代的极有价值的资源。

若将网站名称中包含“blog”的视为博客，我们发现如果不存档博客，基线中的 15.5% 的文档将被排除在国家网络存档之外。其中，67% 的博客文档托管在 .com 域名下，33% 托管在 .PT 域名下的博客中。这是因为大多数流行的博客网站托管在 .COM 域名下，这会增加国家网络中托管在国家代码顶级域名之外的文档数量。