59、孟加拉语情感检测与手写文档倾斜校正研究

孟加拉语情感检测与手写文档倾斜校正研究

在计算机科学领域,文本情感检测和手写文档处理是两个重要的研究方向。文本情感检测能够让计算机理解书面文本的情感内容并做出相应反应,而手写文档处理则有助于从文档中提取有意义的信息。本文将围绕孟加拉语文本情感检测和孟加拉语手写文档倾斜检测与校正展开探讨。

孟加拉语文本情感检测
数据集创建与标注可靠性

在构建情感数据库时,需要收集情感文本数据并进行标注。孟加拉语情感文本从各种公开来源收集,如名言、博客、脸书和油管帖子、诗歌、故事、歌曲、戏剧和小说等,共收集了 5139 条独特的孟加拉语情感文本,并标注了主要情感。

为确保标注的可靠性,使用 Cohen’s Kappa 系数来计算标注者之间的一致性。公式如下:
[
\kappa = \frac{p_o - p_e}{1 - p_e}
]
其中,$p_o$ 是标注者之间的观察一致性,$p_e$ 是在随机假设下标注者之间的预期一致性。如果句子的标注可靠性不够(例如 Kappa 分数 < 0.8),则该句子会被重新标注或丢弃。

以下是标注者与参与者之间针对不同情感类别的 Cohen’s Kappa 分数:
| 类别 | 参与者 1 | 参与者 2 | 参与者 3 | 参与者 4 | 参与者 5 | 平均 Cohen’s Kappa 分数 | 一致性水平 |
| — | — | — | — | — | — | — | — |
| 幸福 | 0.915 | 0.942 | 0.912 | 0.853 | 0.942 | 0.913 | 几乎完美 |
| 悲伤 | 0.833 | 0.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值