科学知识图谱构建:时间切片、链接与节点选择及可视化分析
在科学研究的知识图谱构建中,涉及到诸多关键步骤和方法,这些方法有助于我们更清晰、准确地理解科学领域的知识结构和发展动态。下面将详细介绍时间切片、链接选择、节点选择、交互式可视化以及结构变异分析等方面的内容。
1. 时间切片
时间切片可以采用一年窗口或多年窗口的形式。其主要作用是增强特定年份研究的影响力。相邻的时间切片可以相互重叠,这种重叠能够平滑随时间的变化。例如,将12月发表的文章与次年1月发表的文章,以及6月和7月发表的文章视为同一组是合理的。允许重叠滑动窗口的效果是使各种模式的过渡更加平滑。传统的无时间切片的网络分析是窗口宽度为整个时间间隔时的特殊情况。如果允许重叠年份的持续时间从0到整个时间间隔变化,那么传统方法就是重叠年份为整个时间间隔时的特殊情况。为了简单起见,后续示例使用非重叠时间切片。
2. 链接选择
网络的清晰度通常受多种因素影响,过多的链接会使区分显著模式和常见联系变得困难。因此,有多种减少链接数量的策略。
2.1 去除弱连接
去除网络中的弱连接是常用策略。弱连接往往伴随着较高的不确定性,包括代表性不足的连接。选择去除弱连接的方法有很多,且对剩余网络的影响不同。最简单的方法是按强度对网络中的所有链接进行排序,从列表底部开始去除链接,比如去除强度低于阈值的链接或去除强度最低的20%的链接。但这种方法存在风险,可能会去除没有强连接来维持生存的节点。虽然有人认为这些节点与网络其他部分的连接不强,去除它们损失不大,但弱连接可能带来有价值且意想不到的信息。
在社交网络中,弱连接意味着不同社交圈子的人之间的联系。来自不同社交圈子的
超级会员免费看
订阅专栏 解锁全文
293

被折叠的 条评论
为什么被折叠?



