人工智能在医学信号处理与疾病诊断中的应用
1. 特征提取与分类算法
1.1 倒谱系数
最初,频率倒谱系数是为了辅助识别连续发音短语中的单音节而提出的,并非用于说话者识别。通过计算倒谱系数,可以人工模拟人类听觉系统。这基于人类耳朵是非常精确的说话者识别器这一假设,且有研究支持该假设。倒谱特征的开发是基于人类耳朵和计算机临界带宽之间的显著差异。
为了保留语音流中具有语音学意义的特征,在低频使用线性间隔的频率滤波器,在高频使用对数间隔的频率滤波器。大多数语音传输由频率变化的音调组成,每个音调都有实际频率 (f)(Hz)和使用梅尔标度计算的主观音高。梅尔频率标度在低于 1000 Hz 时是线性间隔的,高于 1000 Hz 时是对数间隔的。以在感知听力阈值以上 40 dB 播放的 1 kHz 音调为例,其音高估计为 1000 梅尔,这在后续计算中作为参考。
使用滤波器组,可以通过分解信号并计算其频率来计算信号的 FCC 系数。就短期能量而言,它提供了梅尔频率标度上频谱的实对数的离散余弦变换(DCT)。频率倒谱系数可用于识别航班预订内容、电话中说出的电话号码以及用于安全的语音识别系统。为了提高鲁棒性,对基本方法提出了一些修改,包括在应用 DCT 之前将对数梅尔幅度提高到合适的幂(约 2 或 3),并最小化低能量部分的影响。
1.2 KNN 分类器
K 近邻(K-NN)算法是机器学习的基本组成部分,基于监督学习技术。为了最大化准确性,该方法假设新数据与现有数据之间存在相似性,并将新实例分配到与现有类别最相似的类别中。K-NN 方法会保留所有可用数据,并根据新数据点与先前分类数据的相似性对其进行分类。这意味着当新数据产生时,可以
超级会员免费看
订阅专栏 解锁全文
3827

被折叠的 条评论
为什么被折叠?



