社交网络中动态群体行为的数据挖掘框架解析
在社交网络的分析中,数据挖掘技术能够帮助我们揭示用户之间潜在的关系和形成的社区。下面将详细介绍一个数据挖掘框架,它可以有效地挖掘社交网络中的信息,发现隐含的兴趣社区。
1. 特征提取
特征提取是信息提取的重要步骤,其目的是寻找可用于构建用户配置文件的主题特征(标签集)。这里采用基于图的主题建模技术,从标签图中提取以标签团形式存在的抽象主题,因此该步骤也被称为主题提取。
- 标签团的定义 :在标签图 (TG = (T, E_{TT})) 中,标签团 (TC) 是一个标签顶点集 (TS \subseteq T),使得 (TS) 中的任意两个顶点之间都存在一条边,即由 (TS) 诱导的子图是完全图。可以表示为 (TC = (TS, E)),其中 (TS) 是对应标签的顶点集,(E) 是边集,且 (E \subseteq {(t_1, t_2) | t_1, t_2 \in TS})。标签图中存在多个这样的标签团,定义 (TC_n) 为有限集 ({TC_1, TC_2, \ldots, TC_n}),其中 (\forall TC_i \subseteq T)。
- 主题提取步骤 :
- 资源 - 标签图(GRL)
- 标签概念层次结构
- 主题提取(TC)
下面是主题提取步骤的 mermaid 流程图:
graph LR
超级会员免费看
订阅专栏 解锁全文
1662

被折叠的 条评论
为什么被折叠?



