92、网络评论过滤与移动设备密码安全分析

网络评论过滤与移动设备密码安全分析

过滤争议性评论

随着互联网的发展,尤其是Web 2.0的出现,用户在互联网上的参与度大幅提升,社交新闻网站变得越来越受欢迎。在这些网站上,用户可以对各种新闻故事或其他用户的评论发表自己的看法。然而,大量的评论中可能包含争议性的“钓鱼”评论,需要进行有效的过滤。

传统的监督式机器学习算法虽然可以对评论进行分类,但需要大量的标注数据,这在实际的网络挖掘问题中是非常困难和耗时的。集体分类是一种半监督学习方法,它利用标注和未标注数据集的关系结构来提高分类的准确性。基于此,我们提出了一种基于集体分类技术的文本分类方法,用于过滤争议性评论。

评论特征提取

我们从西班牙社交新闻网站“Menéame”的评论中提取了三类特征:
1. 统计特征
- 评论正文 :使用向量空间模型(VSM)和词频 - 逆文档频率(TF - IDF)加权方案来表示评论。同时,采用词和n - 元组作为术语进行加权。
- 评论引用次数(入度) :表示该评论在同一新闻故事的其他评论中被引用的次数。
- 评论引用其他评论的次数(出度) :衡量该评论对同一新闻故事中其他评论的引用数量。
- 评论编号 :反映评论的新旧程度。
- 评论与新闻故事摘要的相似度 :使用余弦相似度来计算。
- 评论中的单词与新闻故事标签的重合次数
-

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值