78、广播声音接收与老年护理应用界面设计研究

广播声音接收与老年护理应用界面设计研究

1. 广播声音接收相关研究

1.1 语音区间估计方法精度

语音区间估计方法有两种,分别是提出的 VAD(音素识别 + 响度特征)和字幕区间估计方法。这两种方法的精度比率和召回率都很高,具体数据如下表所示:
| 方法 | 精度比率 | 召回率 |
| — | — | — |
| 提出的 VAD(音素识别+响度特征) | 87.9% | 91.1% |
| 字幕区间估计方法 | 94.7% | 90.6% |

从表中可以明显看出,两种区间估计方法都具有较高的精度,能以高精度估计区间。

1.2 背景声音抑制处理

区间估计完成后,对于被估计为语音区间的部分,采用基于立体声相关性的自适应滤波方法,并调整估计语音和背景声音的混合比例,以实现背景声音的抑制。对于区间的切换部分,应用约一秒的交叉淡入淡出处理,使信号处理的切换更加平滑。

1.3 初步评估实验

1.3.1 测试条件
  • 材料准备 :从区间估计所用的电视剧材料中提取 14 个约 30 秒时长的场景。针对每个场景,准备四种材料:“R”(原始广播声音)、“A”(使用提出的 VAD 获得)、“B”(使用字幕区间估计方法获得)和 “C”(使用正确数据获得)。
  • 对比方式 :对每个场景的四种材料进行两两组合,共六种组合。对于每种组合,使基准材料和评估材料中的正确序列和反向序列随机出现,以考虑排序效应。基准材料和评估材料连续向所有评估者展示两次。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值