利用社交媒体数据提升电信网络告警语义信息及临床研究缩写含义推断
1. 电信网络告警与Twitter数据研究
在电信网络领域,研究人员尝试利用Twitter数据来丰富告警的语义信息。通过分析与告警同时发布且提及“net”的推文,了解其与告警原因及投诉的关联。
- 网络服务投诉案例研究
- 研究人员手动标记了告警期间发布且提及“net”的推文,以确定可能的告警原因和投诉情况。在301条标记的推文中,约43%(132条)可能是投诉。为对比,随机选取100条未匹配告警但含“net”的推文,投诉比例为31%,虽仍较高但明显低于前者。
- 网络运营商名称在推文中很少提及,增加了识别难度。此外,部分问题可能仅影响特定用户的个人网络,不会触发告警。
- 推文中的事件分类
- 研究使用了12个文本分类器,针对事故、庆祝、仪式等12种事件类型进行分类。每个分类器使用200条葡萄牙语推文进行训练,其中一半手动标记为正例,一半为反例。采用最大熵算法,在10折交叉验证中取得最佳效果。
- 各事件类型的分类准确率有所不同,如体育为88%,音乐会为91%,事故和自然均为84%。
- 通过查询关系数据库,对比告警期间和非告警期间各类事件在推文中的提及比例。结果显示,除自然事件外,其他事件在两种情况下提及比例相同。自然事件在与告警匹配的推文中更频繁提及,且该结果具有统计学意义,与之前观察到的告警期间雨相关词汇使用更频繁的结果一致。
| 事件类型 | 匹配告警推文数量 | 匹配告警推文概率 |
|---|
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



