在线评论操纵识别与隐私友好型云存储方案解析
1. 在线评论操纵识别研究
在如今的互联网时代,在线评论对消费者的决策有着重大影响。然而,评论操纵行为也随之出现,影响了评论系统的公正性和可靠性。
研究人员对评论操纵行为进行了深入研究,主要分为促进性操纵和贬低性操纵两种类型。研究使用了来自TripAdvisor关于纽约市酒店场景的评论数据。操纵行为的标注是由三位人工标注者根据评论、评论者和酒店层面之间的逻辑关系进行一致投票产生的,而真实行为的标注则通过聚类方法生成。
研究指定了不同层面和类型的操纵行为的特征集,包括促进性和贬低性操纵。利用这些标注和支持向量机(SVM)学习了多个分类器。结果显示,在评论者和酒店层面可以学习到高精度的分类器,但在评论层面则无法实现,即使考虑了非文本和文本特征。
在评论者和酒店层面,通过SVM分配的权重对指定特征进行排名,如每月平均评论数(AverageNumPerMonth)、贡献均值(Contribution MEAN)和酒店评论矛盾程度(ContradictionDegree)。价值分布表明,使用AverageNumPerMonth和Contribution MEAN等特征可以区分不同的可疑群体,但ContradictionDegree则无法做到。
可疑评论者提供的评论评分分布变化较大。这可能是因为可疑评论者为了最大化利润同时提供虚假的正面和负面评论,或者是为了避免被TripAdvisor的操纵检测机制发现。尽管TripAdvisor采取了防止操纵行为的措施,但仍存在操纵行为试图利用声誉系统。
从实际意义来看,监督学习在应用时通常成本较高,尤其是需要先创建训练标签。但像TripAdvisor和
超级会员免费看
订阅专栏 解锁全文
617

被折叠的 条评论
为什么被折叠?



