网络谣言源识别与微博谣言检测方法研究
一、网络谣言源识别
1.1 问题描述
考虑一个由有限无向图 (G = (V, E)) 表示的网络,其中节点 (v \in V) 代表网络中的用户,边 (e \in E) 代表用户之间的关系,信息在图 (G) 中传播。假设一个未知的谣言源节点 (v^ \in V) 在未知时间 (t^ ) 开始扩散。可以通过一组称为可观测节点的集合来观察扩散过程,任务是通过监控有限数量的可观测节点来定位谣言源。同时,合理假设谣言从源节点 (v^*) 经由最短路径到达传感器节点,谣言传播模型采用 SIR 模型。
假设谣言已在网络中传播,构建一个新的节点网关 (G_I (V, E)),它是 (G(V, E)) 的子图。(\hat{v}) 表示估计的谣言源,且 (G_I \in G),(\hat{v} \in v^ )。定义一组传感器节点 (S = {s_1, s_2, \ldots, s_k}),传感器从节点 (V) 中选取。由于缺乏感染源的先验知识,假设每个节点成为谣言源的概率相等,因此使用最大似然估计器(MLE)算法来估计谣言源。该算法基于谣言中心得分计算似然估计:
(\hat{v} = \arg \max \rho (G_I|v^ = V))
其中 (\rho (G_I|v)) 是在 SIR 传播模型下观察到 (G_I) 的概率。假设 (v \in v^*),只需找到 (G_I) 中所有 (v) 的似然函数值 (\rho(G_I|v)),然后选择最大值对应的节点。
1.2 谣言中心性
谣言中心性最早在相关文献中提出,在谣言源预测研究中被广泛应用。由于
超级会员免费看
订阅专栏 解锁全文
796

被折叠的 条评论
为什么被折叠?



