情感分析:从基础到应用的全面指南
情感表示与词典创建
情感轮盘
Plutchik 的情感轮盘是一种很有价值的情感表示方式。它沿着类似于效价、唤醒度和支配度的维度,以轮盘状来排列情感。在效价上相反的情感位于轮盘的两侧,而支配度值递增的情感则分布在轮盘的花瓣上。这个轮盘的重要作用在于,它从效价、唤醒度和支配度的概念出发,不仅能以结构化的方式表示基本情感,还能将复杂情感表示为基本情感的组合。
手动创建词典
可以利用众包的方式进行手动标注。像 Amazon MTurk 这样的在线平台,能让人创建众包数据集。众包指的是借助基于互联网的群体力量来完成任务,不过这通常需要以清晰、明确的问题形式对任务进行清晰定义。在众包过程中,有以下几点需要考虑:
1. 任务定义 :标注任务要作为给标注者的明确指令。由于众包工作者可能无法直接与任务管理者沟通,所以任务定义必须尽可能明确,加入示例会很有帮助。
2. 后备标签 :提供后备标签很有用,这样模糊的示例就不会被错误标注。例如,除了“积极”和“消极”,还可以设置“无法判断”作为后备标签。
3. 工作者选择 :众包平台上的标注者有时被称为“工作者”。很多众包平台允许任务创建者根据工作者的经验、过去完成的任务数量等多个参数来选择工作者,这些参数通常会浓缩成分数以便选择。
4. 评估集 :众包平台允许任务创建者上传评估集,即一组带有标签的实例。在标注任务中,也会将评估集中的实例呈现给工作者,这样任务创建者就能评估工作者的标注质量,很多情况下还能根
超级会员免费看
订阅专栏 解锁全文
1616

被折叠的 条评论
为什么被折叠?



