基于语义倾向的影响扩散模型及其在意见领袖识别中的应用
1. 引言
互联网的高度开放性吸引了众多人参与在线讨论,使其成为对社会影响巨大的主流媒体之一。两级传播理论指出,新闻常通过意见领袖从大众媒体传播到受众,网络意见领袖在舆论的形成和演变中起着重要作用。
目前,针对网络意见领袖的识别方法有文本挖掘、聚类分析、多属性研究和社会网络分析等。不同的方法各有特点,例如:
- 有人用由七个特征值构成的特征向量描绘意见领袖,结合 EM 聚类算法筛选。
- 有人先通过文本内容、相关信息及作者与读者的关系识别热门博客,再识别意见领袖并应用于口碑营销领域。
- 有人采用兴趣空间对用户聚类,结合加权 Page Rank 算法寻找意见领袖。
- 有人构建影响扩散模型(IDM)计算和识别意见领袖。
- 有人在构建的舆论超网络模型基础上,结合网络拓扑分析和文本挖掘获取意见领袖。
由于中文在计算机媒介通信环境中应用灵活、表意复杂,为充分尊重公众意愿,探索“名副其实”的网络意见领袖,除考虑帖子的回复结构和相关节点的社会网络属性外,还应更关注文本内容及其情感倾向。基于此,提出了基于语义理解的影响扩散模型。
2. IDM 相关分析
IDM 假设:
- 在基于文本的计算机中介通信环境中,人们通过帖子和线程表达观点,回复链反映影响的传递。
- 帖子由词语组成,人们的思想可通过回复链中的词语传播和表达。基于此,将论坛的回复关系抽象为回复结构树,通过计算父子节点帖子中词语数量的比例来衡量帖子的影响力。
然而,IDM 存在一些缺陷:
- 影响传递故障和虚假影响传播。虽然 IDM 在一
超级会员免费看
订阅专栏 解锁全文
761

被折叠的 条评论
为什么被折叠?



