21、基于分层语音技术的测谎系统：原理与应用

原创于 2025-10-11 08:10:17 发布 · 90 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#分层语音技术 #LVAT #测谎系统

智能医疗的未来专栏收录该内容

21 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于分层语音技术的测谎系统：原理与应用

在当今社会，测谎技术在刑事侦查、网络犯罪检测等领域发挥着至关重要的作用。本文将介绍一种基于分层语音技术（LVAT）的测谎系统，深入探讨其工作原理、研究方法、信号处理、特征提取等关键环节，并分析其优势和应用前景。

1. 系统概述

该测谎系统的核心思想是通过隐蔽信息测试获取被测者的输入语音信号。在信号采集过程中，会对采集到的数据进行基本的滤波处理，以提高信号的信噪比（SNR）并降低噪声。强大的独立成分分析技术可以从人类语音信号中分离出精炼且独立的信号，该语音信号由多个叠加信号组成。测谎系统有助于清晰呈现信号并提取特征，如时间、频率、幅度和特征值等，这些特征可从脑电图（EEG）信号中获取。特征提取完成后，将其应用于神经网络（NN）分类器。

Nemesysco的分层语音分析（LVA）技术由Amir Liberman发明。通过识别嫌疑人语音中的情感线索，LVA技术能更好地了解用户在任何时刻的心理状态和情感构成。LVA技术有离线和在线两种工作模式。在离线模式下，它可以分析录制的语音文件。Liberman解释说，LVA技术能够识别和评估各种心理生理反应，这些反应表明被测者的感知发生了变化，这有助于训练有素的操作员寻找新的迹象和线索。法医科学实验室已开始采用LVA工具，用于检测谎言和筛选嫌疑人。LVA技术依赖于语音波动，无需在嫌疑人身体上附加电缆或传感器，语音样本可在线或离线获取。与早期的测谎技术相比，新程序预计能在“几分钟内”产生数据，供法医心理学专家分析。

2. 语音分析

测谎软件常采用语音分析技术，如分层语音分析，可检测受试者语音中的各种压力、情绪反应和认知过程。研究发现，人类语音的频率对诚实度敏感。例如，当一个人诚实时，该范围内的平均声音频率将低于10 Hz，只有在不诚实时才会超过10 Hz。

人体的所有肌肉，包括声带，都会在8 - 12 Hz之间振动，这通常被称为反馈循环，类似于恒温器或加热器通过在高低温度之间振荡来维持平均温度。我们的肌肉以同样的方式收紧和放松，以保持恒定的张力。当我们感到压力时，例如说谎且不想被发现时，身体会为战斗或逃跑做准备，肌肉的振动频率会从8 - 9 Hz增加到11 - 12 Hz，这是一个较难操作的频率范围。

3. 研究方法

步骤1：使用分层语音技术进行测谎 ：通过分析语音信号中的特征，初步判断被测者是否说谎。
步骤2：使用神经网络进行测谎确认 ：将提取的特征输入神经网络分类器，进一步验证测谎结果。

4. 测谎系统的整体算法

步骤1：输入样本 ：获取被测者的语音样本。
步骤2：使用有罪知识测试 ：设计相关问题，观察被测者的反应。
步骤3：预处理 ：对输入的语音信号进行滤波、降噪等处理。
步骤4：特征提取 ：从预处理后的信号中提取关键特征。
步骤5：将特征传递给NN分类器 ：将提取的特征输入神经网络分类器进行分析。
步骤6：训练和测试 ：使用已知的语音样本对神经网络进行训练和测试。
步骤7：分类 ：根据神经网络的输出结果，判断被测者的回答是真实还是虚假。

5. 信号预处理

信号处理的第一步是输入语音预处理，这是一种滤波技术。通过高通滤波器去除低频噪声，通过低通滤波器去除肌电图（EMG）活动等高频噪声。通常还会去除电源噪声，使用平均均值参考方法降低电源线干扰、电子放大器和外部放大器产生的噪声。

评估各通道以计算均值，然后从原始原始信号值中减去该均值。为了减少由于基本频率节律引起的个体差异的影响，并降低计算复杂度，会进行归一化处理，将所有与不同元素相关的值归一化到0到1的范围内。

6. 特征提取

特征是信号的基本属性，有助于表征原始信号。特征提取在声音识别系统中至关重要，被视为系统的核心。它是从人类语音中提取少量数据的方法，可用于描述每个声音。特征提取是从预处理后的人类脑电图信号中获取特征值的过程。通过将从语音输入中提取的特征与已知声音进行比较来检测未知人类语音的方法称为特征匹配，梅尔频率倒谱系数（MFCC）可以在本项目中实现这一功能。

7. 梅尔频率倒谱系数（MFCC）

MFCC是从声音信号中提取特征的最著名方法。在该技术中，音频信号主要通过代码本和物种声音进行分析，这是一种基于MFCC特征提取的声音识别功能。MFCC矩阵的使用提高了在背景噪声中对每个人类语音输入的训练过程。声音识别框架是元素提取和协调的最基本程度，其主要目标是使用MFCC检测人类输入声音中的谎言。

预加重 ：调制频率分析表明，与其他情况相比，噪声程度较高。为了提高信噪比，对较高频率进行预加重。如果声音信号为x(n)，则滤波器的输出为X2(n)，归一化因子为a。
分帧：输入语音信号的声音识别是非平稳的。当帧太大时，时间分辨率会受到影响；当帧太小时，频率分辨率会受到影响。频率分辨率和时间分辨率之间存在良好的关联。当信号与较小的信号耦合时，分帧对于有效结果非常重要，它可以从幅度上进行修改。
汉明窗 ：为了消除断点，避免汉明窗的起始和结束帧出现干扰，这会对频率响应产生负面影响。与其他加窗策略相比，所有帧都用汉明窗进行扩展，以保持连续性。人类语音输入信号用X(n)表示，其中n = 0,1,2,…N - 1。在进行分段之前，对信号进行汉明窗处理以增强它。
快速傅里叶变换（FFT） ：使用FFT将时域信号转换为频域信号。由于这种转换，信号在帧中会被中断。如果在帧计算期间不停止声音信号，则在帧的开始和结束处会出现带有间隙的变换。有两种方法可以处理这种情况：（1）使用汉明窗对帧进行聚合，以在起始和结束位置获得连续的集体信号；（2）创建一组大小相等的帧。在帧的开始和结束处进行加窗处理可以减少干扰。完成此阶段后，连续的人类语音信号将转换为加窗帧，这些加窗帧经过FFT转换为幅度谱。通过指定分辨率和主观频率尺度进行频谱分析，合成梅尔频谱。该频谱转换为帧，与FFT不同，最终输出为梅尔倒谱，其具有可用于检测语音中谎言的特性。

8. 神经网络与测谎

使用神经网络（NN）可以解决分类问题。在红棕象甲噪声的训练和测试中采用了NN方法。NN有三层：第一层接收收集到的特征，并计算输入向量和训练输入向量空间，这有助于构建显示训练数据的向量组件；第二层将所有输入合并为一个单一的向量可能性，系统能够处理每个人类语音信号；最后一层用于增强对人类语音信号中谎言的检测。为了确保结果准确，系统在无噪声环境中进行训练。

声音识别通过计算机系统对人类对话的语音信号进行训练。通过使用两种类型的声音实现可识别性：用于训练目的的输入声音和未用于训练的未识别声音。

以下是测谎系统的整体流程mermaid图：

graph LR
    A[输入样本] --> B[有罪知识测试]
    B --> C[预处理]
    C --> D[特征提取]
    D --> E[传递特征给NN分类器]
    E --> F[训练和测试]
    F --> G[分类]

综上所述，基于分层语音技术的测谎系统通过结合语音分析、信号处理、特征提取和神经网络等技术，为谎言检测提供了一种有效的方法。该系统具有无需接触被测者、快速产生结果等优势，在刑事侦查、网络犯罪检测等领域具有广阔的应用前景。未来，随着技术的不断发展，该系统的准确性和可靠性有望进一步提高。

9. 实验结果与讨论

在癫痫发作检测的测试阶段，测试输入为语音信号。图11.2展示了所提出技术在特征提取方面与其他方法（如隐马尔可夫模型（HMM）、高斯混合模型（GMM）和MFCC）的比较结果。从图中可以看出，采用MFCC的建议技术产生的结果优于其他现有技术。

技术方法	特征提取效果
基于MFCC的建议技术	优
隐马尔可夫模型（HMM）	一般
高斯混合模型（GMM）	一般
MFCC（传统）	一般

图11.3显示了不同特征提取技术所花费的时间。在分析语音时，需要使用图11.4所示的预处理方法消除安静声音。图11.5描绘了特征提取过程，图11.6展示了如何使用神经网络对语音信号进行训练和测试。图11.7 - 11.9展示了所提出模型的结果，该分类方法根据输入语音信号（正常或谎言）呈现出测谎结果。

10. 结论

一种有效的方法，即脑电图（EEG），可用于了解大脑活动与刺激之间的关系。内部刺激（如测谎）会引发大脑相应部分的反应，思维刺激可用于评估欺骗状态，这与大脑的说谎区域相关。在检测过程之前，使用EEG数据集进行预处理，然后对神经网络进行训练和测试，接着使用MFCC提取响应特征。

在本研究中，针对语音输入信号的沉思和标准部分计算了方差、功率和均方根等统计指标。结果表明，由于认知活动，颞叶信号受到的影响更为明显。这些指标有助于深入了解认知过程对语音输入信号的影响。因此，神经网络分类器有助于识别可能为虚假或真实的回答之间的差异。

以下是整个测谎系统从信号采集到最终分类的详细步骤流程图：

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
    classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px

    A([开始]):::startend --> B(语音信号采集):::process
    B --> C(基本滤波处理):::process
    C --> D(独立成分分析):::process
    D --> E(特征提取):::process
    E --> F{特征匹配?}:::decision
    F -->|是| G(传递特征到NN分类器):::process
    F -->|否| E
    G --> H(训练和测试NN):::process
    H --> I{分类结果}:::decision
    I -->|真实| J([输出真实结果]):::startend
    I -->|虚假| K([输出虚假结果]):::startend

11. 技术优势与应用场景

基于分层语音技术的测谎系统具有诸多优势。首先，它无需在被测者身体上附加电缆或传感器，不会给被测者带来额外的不适，具有良好的用户体验。其次，该系统能够在短时间内产生数据，相比早期测谎技术，大大提高了检测效率，能够快速为相关人员提供分析结果。

在应用场景方面，该系统在刑事侦查中可用于筛选嫌疑人、判断证人证言的真实性，为案件侦破提供重要线索。在网络犯罪检测中，可对嫌疑人的语音进行分析，帮助识别网络诈骗、虚假信息传播等行为。此外，在商业谈判、安全审查等领域也具有潜在的应用价值。

12. 未来展望

虽然基于分层语音技术的测谎系统已经取得了一定的成果，但仍有许多方面值得进一步研究和改进。未来，可以探索更先进的信号处理和特征提取方法，以提高系统的准确性和可靠性。同时，可以结合更多的生理和心理指标，如面部表情、眼动数据等，实现多模态的测谎，进一步提升检测效果。此外，随着人工智能和机器学习技术的不断发展，可以对神经网络进行优化和改进，使其能够更好地适应不同的语音环境和被测人群。

总之，基于分层语音技术的测谎系统为谎言检测提供了一种创新的方法，具有广阔的发展前景和应用潜力。通过不断的研究和改进，有望在更多领域发挥重要作用，为社会的安全和稳定做出贡献。