多媒体取证中的特征挖掘与模式识别
在多媒体取证领域,音频和图像的隐写分析是重要的研究方向。下面将详细介绍相关的技术和方法,包括音频的Mel倒谱分析、图像的统计特征及特征挖掘等内容。
1. 基于信号的Mel倒谱音频隐写分析
在语音处理中,Mel频率倒谱是声音短期功率谱的一种表示。Mel频率倒谱系数(MFCCs)共同构成了Mel频率倒谱。Mel倒谱常用于表示人类语音和音乐信号。受语音识别成功的启发,Kraetzer和Dittmann提出了基于Mel倒谱的语音隐写分析方法,包括以下两种类型的Mel倒谱系数:
- Mel频率倒谱系数(MFCCs) :用sfmel1, sfmel2, …, sfmelM表示,其中M是MFCCs的数量。对于采样率为44.1 kHz的信号,M的值为29。MFCCs可以通过以下公式计算:
[
MelCepstrum = FT (MT (FT (f))) =
\begin{bmatrix}
sfmel1 \
sfmel2 \
\cdots \
sfsmlM
\end{bmatrix}
]
- 滤波后的Mel频率倒谱系数(FMFCCs) :可以通过以下公式计算:
[
FilteredMelCepstrum = FT (SpeechBandFiltering (MT (FT (f)))) =
\begin{bmatrix}
sfmel1 \
sfmel2 \
\cdots \
sfmelM
\end{bmatrix}
超级会员免费看
订阅专栏 解锁全文
22

被折叠的 条评论
为什么被折叠?



