数据治理-分类法

分类法在数据治理中起到关键作用,通过控制词汇表减少歧义和同义词。扁平、层次、多重层级、面和网状是常见的分类法结构。层次分类法如地理信息,多重层级结构适合复杂场景,面分类法应用于元数据,网状分类法常见于推荐引擎和主题词表。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        分类法是一种命名结构,包含用于概述主题、启用导航和搜索系统的受控词表。分类法有助于减少歧义并控制同义词,层次分类法包含了对索引者和搜索者都有帮助的多种类型的父/子关系。这样的分类法常用于向下扩展分类。

        分类法可以有多种不同的结构:

  1. 扁平分类法:在受控类别集之间没有关系,所有类别都是平等的。这类似于列表。例如,一个包含多个多家的列表;
  2. 层次分类法:它是一种树结构,其中节点通过规则相互关联。层次结构至少具有两个级别并且是双向的。向上移动层级会扩展类别;向下移动会细化类别。一个能够说明这一点的例子是地理信息,从所属大陆直到详细的街道地址;
  3. 多重层级结构。它是具有多个节点关系规则的树状结构。子节点可能有多个父节点。父节点也可以共用一个祖父节点。因此,遍历路径可能会很复杂,所以必须注意避免潜在的无效遍历;从与父节点相关的节点开始向上遍历而非祖父节点。然而,复杂的多重层级结构可能更适合面分类法。
  4. 面分类法,它指的是每个节点与中心节点相关联,其形状看起来向星型图。每个面是中心对象的属性。这里的例子是元数据,其中每个属性(创建者、标题、访问权限、关键字、版本等)是内容对象的一个面。
  5. 网状分类法。既可用于层级结构,也可以用于刻面结构。网状分类中的任何两个节点都基于它们的关联来建立连接,其中一个例子就是推荐引擎,另一个例子就是主题词表。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

世润

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值