音频水印技术:原理、评估与算法解析
1. 心理声学原理
心理声学致力于建立模拟人类听觉系统(HAS)的模型,以此让音频水印技术能够分析宿主音频信号,使水印尽可能不可听。
1.1 听觉系统生理结构
人类的外周听觉系统由外耳、中耳和内耳组成:
- 外耳:负责收集空气中的声波,并将其传导至耳朵内部。
- 中耳:把声波的声学振动转化为机械振动,再传递给内耳。
- 内耳:将机械能转换为神经冲动,传至大脑。
1.2 心理声学基本概念
- 声压级(SPL) :衡量声音强度的指标。
- 响度 :人耳对声音强弱的主观感受。
- 人类听觉范围 :一般为 20Hz - 20kHz。
- 安静阈值 :人耳在安静环境中能听到的最小声音强度。
- 临界带宽 :人耳能够分辨的最小频率范围。
1.3 听觉掩蔽效应
听觉掩蔽分为同时掩蔽和非同时掩蔽:
- 同时掩蔽 :窄带噪声的掩蔽能力优于纯音。
- 非同时掩蔽 :以掩蔽后效应为例,输入音频的修改包络可用于近似掩蔽后效应,估计的掩蔽曲线随信号包络增加而上升,并按指数函数 $e^{-\alpha t}$ 衰减,衰减常数 $\alpha$ ($\alpha \geq
超级会员免费看
订阅专栏 解锁全文
989

被折叠的 条评论
为什么被折叠?



