基于危机相关推文的不同分类器比较分析
1. 引言
Twitter 作为热门的微博平台,允许用户通过社交网络渠道发布短消息(推文)。近年来,它已成为重要的通信媒介,不仅用于发布公告,还广泛传播各类信息。用户借助 Twitter 实时了解新闻,在大规模紧急情况时,它更是信息交流的有效工具。
在危机事件发生时,Twitter 上会涌现大量推文,因此需要在短时间内过滤这些推文,提取有价值的信息,而首要任务是识别与危机相关的推文。本文着重探讨不同分类算法,以更准确地完成这项工作。
以下是本文的主要贡献:
1. 探索传统自然语言处理(NLP)技术和词嵌入方法,使数据集适应不同的机器学习算法。
2. 运用机器学习算法对推文是否与危机相关进行分类。
3. 探索神经网络架构的超参数调整,以确定其在推文分类中的适用性。
4. 对不同分类器进行比较分析,测试它们在危机相关推文分类中的有效性。
2. 相关工作
- 推文分类 :研究人员对文本分类算法进行了详细研究,并将传统文本分类算法应用于社交媒体文本分类。例如,Brynielsson 等人描述了一种收集大量相关推文并标注情感标签的方法,用于创建训练数据集。还有许多人利用社交媒体上的短文本数据进行各种任务,如事件跟踪、推荐和有影响力用户预测。
- Twitter 在应急管理中的应用 :Gelernter 和 Mushegian 讨论了 Twitter 在紧急情况下的应用,指出当新闻网站无法正常工作时,Twitter 可成为重要的信息和交流来源。Olteanu 等人对不
危机推文分类器性能对比分析
超级会员免费看
订阅专栏 解锁全文
26

被折叠的 条评论
为什么被折叠?



