基于对话模式的会议参与者角色自动检测
在会议分析领域,自动检测参与者的角色具有重要的实际意义。它有助于根据特定角色的发言贡献回顾会议,还能支持会议分割等更高级的任务。本文将围绕使用无内容的发声视野(Vocalisation Horizon)特征自动检测发言者角色展开探讨。
1. 相关研究基础
- 前人工作 :一些研究表明,简单易计算的特征,如发言者更换频率,可用于检测参与者角色。例如,Banerjee和Rudnicky的工作中,分类器的输入来自沿时间序列的滑动窗口,他们设计了会议状态分类法,并从窗口内的音频材料中提取特征用于会议状态和参与者角色检测。Laskowski应用新特征进行角色分类,在AMI语料库上取得了一定的分类率。
- 研究目标 :我们采用与Banerjee和Rudnicky类似的特征,但以不同的格式应用于更通用的会议语料库——AMI语料库,旨在评估无内容的发声视野特征在自动检测发言者角色方面的实用性。
2. 数据准备
- AMI语料库介绍 :AMI语料库包含大量会议音频记录,这些会议模拟了电子公司中员工讨论新型遥控设备开发的场景。参与者来自瑞士的IDIAP、英国的爱丁堡大学和荷兰的TNO三个机构。几乎所有会议都有四个固定角色:项目经理(PM)、工业设计师(ID)、用户界面设计师(UI)和营销专家(ME)。参与者在会议前会接受培训。
- 角色检测思路 :由于AMI语料库中的角色固定,我们想了解同一角色的不同参与者是否表现出
超级会员免费看
订阅专栏 解锁全文
1069

被折叠的 条评论
为什么被折叠?



