声门闭合瞬间检测算法的性能评估与分析
在声门闭合瞬间(GCI)检测领域,可靠性和准确性是两个关键的考量因素。除了可靠性之外,准确性同样重要。
1. 准确性评估指标
对于在计算识别率(IDR)时所统计的每个喉周期,参考GCI与检测到的GCI之间的时间误差记为ξ。有两个衡量准确性的标准:
- 识别准确性(IDA) :时间误差ξ的标准差。IDA值越低越好。
- 识别偏差(IDB) :绝对时间误差的平均值。这里计算平均值时采用绝对时间误差,以避免误差相互抵消。IDB值越低越理想。
2. 性能比较
2.1 干净语音的GCI检测
通过对干净语音的实验,比较了GMAT与ZFR、MSM、SEDREAMS等算法的性能,具体数据如下表所示:
| Database | Method | IDR (%) | FAR (%) | MR (%) | IDA (ms) | IDB (ms) |
| — | — | — | — | — | — | — |
| KED | MSM | 97.19 | 1.66 | 1.15 | 0.45 | 0.30 |
| | ZTFR | 98.45 | 1.25 | 0.30 | 0.64 | 2.38 |
| | SEDREAMS | 99.51 | 0.35 | 0.15 | 0.51 | 0.41 |
| | GMAmax | 97.88 | 1.57 | 0.54 | 0.30 | 0.19 |
| | GMATprod | 97.77 | 1.74 |
超级会员免费看
订阅专栏 解锁全文
45

被折叠的 条评论
为什么被折叠?



