广播声音接收与老年护理应用界面设计研究
1. 广播声音接收相关研究
1.1 语音区间估计方法精度
语音区间估计方法有两种,分别是提出的 VAD(音素识别 + 响度特征)和字幕区间估计方法。这两种方法的精度比率和召回率都很高,具体数据如下表所示:
| 方法 | 精度比率 | 召回率 |
| — | — | — |
| 提出的 VAD(音素识别+响度特征) | 87.9% | 91.1% |
| 字幕区间估计方法 | 94.7% | 90.6% |
从表中可以明显看出,两种区间估计方法都具有较高的精度,能以高精度估计区间。
1.2 背景声音抑制处理
区间估计完成后,对于被估计为语音区间的部分,采用基于立体声相关性的自适应滤波方法,并调整估计语音和背景声音的混合比例,以实现背景声音的抑制。对于区间的切换部分,应用约一秒的交叉淡入淡出处理,使信号处理的切换更加平滑。
1.3 初步评估实验
1.3.1 测试条件
- 材料准备 :从区间估计所用的电视剧材料中提取 14 个约 30 秒时长的场景。针对每个场景,准备四种材料:“R”(原始广播声音)、“A”(使用提出的 VAD 获得)、“B”(使用字幕区间估计方法获得)和 “C”(使用正确数据获得)。
- 对比方式 :对每个场景的四种材料进行两两组合,共六种组合。对于每种组合,使基准材料和评估材料中的正确序列和反向序列随机出现,以考虑排序效应。基准材料和评估材料连续向所有评估者展示两次。