认知社区分类法的简洁表示
在知识领域的研究中,我们常常会遇到需要对认知社区(Epistemic Communities,ECs)进行分类和表示的问题。概念格是一种常用的工具,但它在处理实际数据时可能会变得复杂且难以阅读。本文将介绍两种提高线图可读性的方法:修剪和嵌套,并探讨如何将它们结合使用,以获得更简洁、更有意义的认知社区分类表示。
1. 概念格的问题与挑战
概念格在识别和组织 ECs 方面具有一定的优势,但它也存在一些问题。首先,概念格中的 ECs 数量可能非常大,即使是从相对较小的上下文中导出的图也可能变得复杂。其次,由于数据中的噪声或实际的细微差异,概念格中可能包含一些彼此过于相似的节点,这些节点对于我们的目的来说可能是无关紧要的。此外,我们还希望能够区分主要趋势和次要子领域,并提供不同精度级别的表示。
为了解决这些问题,我们可以考虑计算概念格的上部分(序滤子),例如只保留覆盖至少 n% 作者的概念,从而得到一个“冰山格”。然而,这种方法可能会忽略一些小但有趣的群体,因此我们还需要计算“大” ECs 的所有下邻(真子群)。此外,我们还可以使用专门为构建冰山格设计的算法或频繁项集挖掘社区的其他算法。虽然这些方法可以显著减少概念的数量,但从手动分析的角度来看,仍然可能不够令人满意。
2. 提高线图可读性的方法
为了提高线图的可读性,我们可以采用两种方法:修剪和嵌套。
2.1 修剪
修剪是指过滤掉那些不满足特定约束条件的概念。在之前的研究中,人们使用了结合各种标准(如范围大小、与顶部的最短距离、下邻数量等)的启发式方法来对 ECs 进行评分,并只保留前 n 个最佳概念。然而,这种方法需要事后手动分析,并且不
超级会员免费看
订阅专栏 解锁全文
844

被折叠的 条评论
为什么被折叠?



