31、探究无关COVID - 19推特表达的影响

探究无关#COVID - 19推特表达的影响

1. 推特垃圾信息检测方法

在推特环境中,存在多种检测垃圾信息和垃圾用户的方法,以下是一些常见方法的介绍:
| 方法 | 描述 | 特征 | 局限性 |
| — | — | — | — |
| 监督式机器学习方法 | 基于用户行为和推文内容属性,使用机器学习分类器(如支持向量机)对垃圾用户与非垃圾用户、垃圾推文与非垃圾推文进行分类,然后手动验证以确定机器学习算法的准确性 | 基于内容、基于用户 | 相当一部分垃圾用户可能被误分类为非垃圾用户,少量非垃圾推文可能被分类为垃圾推文 |
| 社交图分析 | 利用基于社交关系的图属性,应用于机器学习算法(如k - 最近邻、决策树、朴素贝叶斯、随机森林、逻辑回归、支持向量机和极端梯度提升)来检测垃圾用户 | 基于用户 | 少量垃圾用户可能被误分类为非垃圾用户 |
| 用户资料和URL使用分析 | 使用基于内容的特征(如唯一URL比率、URL与推文比率、用户日均推文数、用户每条推文的平均点赞数),应用于机器学习算法来检测垃圾用户 | 基于用户 | 少量垃圾用户可能被误分类为非垃圾用户 |
| 实时检测(使用现成特征) | 使用现成的动态特征(包括用户资料、账户信息、成对互动、推文活动和发布行为等)和机器学习模型进行检测 | 基于内容、基于用户 | 由于推文不是英文以及推文中出现的标记(无关符号、表情符号)可能导致误分类,这些会让分类器产生混淆 |
| 语言统计分析 | 利用基于语言模型的特征和机器学习系统,对热门话题进行实时垃圾信息检测 | 基于内容 | 假阳性率略高 |
| 实时可信度评估 | 使用可信度评估工具(如TweetCreed),通过大量特征实时

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值