波兰推特情感与情绪标注及时间序列异常检测研究
波兰推特情感与情绪标注
在对波兰推特数据进行情感和情绪标注时,由于数据在语言和主题上具有多样性,为标注工作提供明确无误的指导十分困难,这导致标注者之间的一致性较低。其中,情感标注的一致性水平(76.20%)高于情绪(55.29%)和讽刺(25.27%),整个数据集的总体一致性(PSA)为66.31%。
最终标注的生成
生成最终标注数据集分为两个步骤:
1. 自动汇总标注 :根据表1中的条件自动汇总标注,同时考虑冲突的情绪对。设定一种情绪至少有两个一致标注的阈值,并且要求给定情绪的标注数量要高于其对立情绪的标注数量。由于情感并不总是与情绪直接匹配,所以情感是独立进行标注的,且标注条件不会产生“无”的情感标注。
|结果|条件|示例|
| ---- | ---- | ---- |
|情绪A|AND(A > B;A > 1)|joy = 3; sadness = 1|
|情绪B|AND(A < B;B > 1)|joy = 1; sadness = 2|
|冲突|OR(AND(A = 1;B = 1);AND(A = 2;B = 2))|joy = 2; sadness = 2|
|无|else|joy = 1; sadness = 0|
|积极(A)|AND(A > B;A > C;A > 1)|positive = 4; negative = 0; neutral = 1|
|消极(B)|AND(A < B;B > C; B > 1)|positiv
超级会员免费看
订阅专栏 解锁全文
4417

被折叠的 条评论
为什么被折叠?



