利用BlogTracker助力博客圈分析:COVID-19案例研究
1. 引言
博客圈已经成为一个围绕各种热门话题进行讨论和交流的虚拟社区。随着热点话题的叙事、影响力和情感从传统媒体和线下互动转移到线上社区,博客为各类用户(博主、评论者和粉丝)带来了更多的虚拟参与机会。与传统媒体不同,博客不受长期的审查和监管限制,这使得其成为公众表达观点的替代平台。
博客允许作者分享无限量的信息和内容,如视频、文本或图像,从而成为塑造叙事和影响具有相似信仰和社会价值观受众的有力工具。然而,分析师在研究博客圈每日产生的海量数据时面临诸多挑战,难以找到具备跟踪博客圈事件、分析讨论、提取和可视化叙事、检测热点关键词、突出有影响力的博主以及理解博客情感等功能的免费公共资源。
为解决这些问题,我们开发了BlogTracker应用程序。此前的研究虽展示了BlogTracker的部分功能,但主要集中在有影响力的活动上,未全面研究博客圈的各个方面。本次工作将扩展之前的研究,以COVID - 19为例,展示BlogTracker如何为博客圈分析提供支持,包括明确展示COVID - 19叙事的形成和可视化等重要功能。
2. 研究背景
多年来,博客圈研究不断增加,但随着世界的变化,新的见解也在不断涌现。博客研究涉及叙事、主题建模、内容多样性、博客发布频率和情感分析等多个方面。不过,挖掘博客中的大量观点存在挑战,因为博客的发布具有无监管性,且博主是自身博客的传统监管者。
文本挖掘是研究博客圈的关键,收集数据和跟踪博客属于文本挖掘应用的一个子领域,即博客挖掘。现有研究指出了博客数据持续计算分析面临的挑战,以及现有分析工具在语法机制和语义处理能力方面的局限性。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



