10、危机相关推文分类器对比分析与改进的极限学习机

杠精协会主席

于 2025-09-10 12:14:50 发布

阅读量26

点赞数

CC 4.0 BY-SA版权

分类专栏：自然启发计算的智慧文章标签：危机相关推文分类器对比极限学习机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/docker7nomad/article/details/152145789

自然启发计算的智慧专栏收录该内容

27 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

危机相关推文分类器对比分析与改进的极限学习机

危机相关推文分类器对比分析

在当今社会，Twitter 等社交媒体平台在危机时期成为了重要的信息传播渠道。对危机相关推文进行有效分类，有助于相关部门及时获取关键信息，做出更好的应急决策。下面将详细介绍不同分类器在危机相关推文上的对比实验。

实验二：机器学习算法对比

本实验将上一实验中确定参数的神经网络分类器与其他机器学习算法进行对比，使用了 CrisisLexT6 的六个数据集以及多种特征向量创建方法。

数据处理
- 分别使用 CrisisLexT6 中的每组推文，采用 5 折交叉验证法计算准确率。
- 运用七种特征向量化方法创建测试集，包括词频、归一化词频、TF - IDF、经过处理的词频、经过处理的归一化词频、经过处理的 TF - IDF 以及词嵌入。由于在 k 折交叉验证的每次测试中都会创建向量，所选词汇表会因数据集不同部分的省略而有所差异，导致基于词频的向量在每次测试中的维度不同。
训练与评估
- 测试了四种机器学习算法的准确率：
  - 前三种算法（朴素贝叶斯、逻辑回归和支持向量机）使用 scikit - learn API 实现，采用默认参数值。对于朴素贝叶斯，针对基于词频的特征向量假设为多项分布，针对基于词嵌入的特征向量假设为高斯分布。
  - 逻辑回归使用 L2 正则化，停止准则的容差为

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。