社交网络中的马甲账号检测与大数据物联网下基于位置服务的伦理问题
社交网络中的马甲账号检测
在社交网络中,马甲账号的存在对网络安全和用户体验构成了威胁。为了应对这一问题,研究人员提出了多种检测方法。
目前主流的检测方法主要分为基于言语特征和基于非言语特征两类。基于言语特征的方法更关注文本内容,例如账号发言的单词数量、句子长度、文本相似度等;基于非言语特征的方法则更侧重于用户行为,如用户登录时间、发帖数量和评论数量等。然而,如今马甲账号的伪装和隐藏手段愈发复杂,仅通过文本内容和简单的用户行为分析,很难准确识别马甲账号。
为了解决这一问题,提出了一种基于自适应多源特征融合的马甲账号检测方法。该方法将文本言语特征和行为特征进行更全面的分析,把马甲账号识别问题转化为分类问题。通过自适应多源特征融合,根据具体问题自动整合言语和非言语特征,选择最佳的特征组合。
以下是该方法的具体步骤:
1. 言语特征提取 :
- 收集社交媒体中每个用户的所有评论文本,形成新文本。
- 使用固定维度的word2vec模型训练词向量矩阵。
- 利用训练好的词向量矩阵将每个用户的新文本转换为词向量,再拼接成句子向量。
- 提取言语特征,如文本长度、问题频率和情感词数量等,记为 (N = {n_1, n_2, …, n_i})。
2. 非言语特征提取 :非言语特征包括用户的发言时间、每日评论数量、交互数量和每日在线访问次数等,记为 (M = {m_1, m_2, …, m_j})。
3. 自适应多源特征融合 :
-
马甲账号检测与LBS伦理问题
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



