社交媒体意见分析与以太坊庞氏骗局检测
社交媒体意见分析
在社交媒体意见分析领域,有多种方法用于检测争议性内容。
图嵌入方法
- Metapath2vec :用于异构图嵌入,基于元路径游走获取包含各种标签的顶点序列,然后使用异构Skip - Gram生成嵌入向量。元路径策略预先设定,且通常是对称的。
- node2vec和CTDNE :嵌入维度设置为128。node2vec的最优关键参数p和q通过在{0.5, 1, 2}上进行网格搜索获得。
对于metapath2vec方法,节点分类过程如下:
1. 将所有节点分为三种类型:新闻、评论和用户,然后细分评论节点。
2. 制定五条元路径:
- 评论→新闻→评论
- 评论→评论
- 评论→用户→评论
- 评论→评论→新闻→评论
- 评论→评论→用户→评论
基于这些元路径,使用metapath2vec方法将原始网络映射到128维向量空间进行量化。对于所有基于嵌入的方法,采用逻辑回归(LR)和随机森林(RF)作为分类器进行争议检测。
性能比较
在头条数据集上比较PathMerge方法与基线方法的性能,评估指标包括宏平均精度(Avg. P)、宏平均召回率(Avg. Recall)、宏平均F1分数(Avg. F1)和准确率(Avg. Acc)。
| 头条数据集 | 方法 |
|---|
超级会员免费看
订阅专栏 解锁全文
1037

被折叠的 条评论
为什么被折叠?



