
今天小王学长跟大家谈谈实时语音质量监控系统的前世今生, 实时语音想必大家都不陌生,微信语音聊天、视频直播,生活中的例子比比皆是。
在过去的语音通信系统中,影响语音质量的因素有很多,包括但不仅限于延时(delay)、丢包(packet loss)、包延迟变化(packet delay variation)、回声(echo)、以及由于编码造成的失真。
语音质量评估方法总的来说可以分为三种:有参考客观评价方法、主观评价方法和无参考客观评价方法。
有参考客观评价方法:
是指把原始参考音视频与失真音视频在每一个对应帧中的每一个对应像素之间进行比较。准确的讲,这种方法得到的并不是真正的视频质量,而是失真音视频相对于原始音视频的相似程度或保真程度。最简单的方法如均方误差 MSE 和峰值信噪比 PSNR,其应用比较广泛。
PESQ 语音质量作为衡量语音传输性能的一个重要指标,如何得到准确、可靠的 QoE(体验质量)评价系统已成为当前研究的重点,PESQ(perceptual evaluation of speech quality,语音质量评价算法)是由 ITU 提出的基于 QoE 的语音质量评价算法,并随之成了 ITU-T P.862 标准。 PESQ 算法是当前比较流行的语音质量评价算法,说到 P.862 标准,P.861 PSQM 是最早的标准,ITU-T P.861 也叫做 PSQM,是根据 PAQM 推倒出来的一种语音质量评估体系。目前,P.862 PESQ、PESQ-WB 是应用最广泛的有参考评价方法,最新的有参考评价方法有 P.863 POLQA,这些都是依赖无损参考信号的。

最低0.47元/天 解锁文章
350

被折叠的 条评论
为什么被折叠?



