网络欺凌检测与乐器识别研究:数据驱动的创新探索
1. 网络欺凌检测研究
在当今数字化时代,网络欺凌已成为一个严重的社会问题。为了有效检测网络欺凌行为,研究人员提出了一种新的混合深度模型 HMMF。
1.1 数据与特征
- 评论信息 :评论的数字侧面信息,通过特定架构进行组合和建模。
- 用户信息 :由用户名、用户发布头条数量、总点赞数、粉丝数和关注数五个数据字段组成,代表用户特征和个人资料信息。用户名使用特定架构建模,其他四个字段组合并使用另一架构建模。
1.2 实验设置
为了进行公平比较,研究在真实世界数据集 JRTT 上进行了一系列对比实验。实验使用了几种中文预训练模型,包括 BERT、XLNet、ERNIE、RoBERTa 和 MacBERT 来初始化句子嵌入和词嵌入。具体设置如下:
- 填充大小为 256,批量大小为 10。
- 丢弃率为 30%,学习率为 0.00005。
- 选择 Adam 优化器,轮数参数设置为 30。
- 在数字数据编码中,层数和头数设置为 3。
1.3 对比模型介绍
- BERT :谷歌推出的语言转换模型,是在大型语料库上预训练的通用语言模型,用于自然语言处理任务需经过预训练和微调两个步骤。
- XLNet :2019 年由卡内基梅隆大学和谷歌大脑团队发布的 BERT 变体,在 20 个任务上优
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



