语音性别识别与云集成医院分配系统的技术洞察
1. 语音性别识别系统
1.1 现有研究基础
在语音性别识别领域,曾有研究使用 93 个特征以及 k - 近邻(KNN)、多层感知器(MLP)、支持向量机(SVM)、朴素贝叶斯和随机森林这五种分类器进行性别识别任务。以韩国语音数据为例,探索了训练数据大小的影响,发现数据量较小时性能会下降,使用 20% 的总数据时识别率约为 65%,并且随着语音长度的增加,分类器的性能逐渐提高,其中 SVM 分类器的性能最佳,准确率达到 90%。还有研究从 93 位说话者的语音中提取线性预测倒谱系数(LPC)特征,并使用人工神经网络(ANN)进行性别识别,识别率达到 93.3%。
1.2 LDASDR 算法
为了实现特征集的降维,同时保持类别间的最大可变性和类别内的最小可变性,引入了线性判别分析逐步降维(LDASDR)算法。该算法将性别识别问题视为一个两类分类问题,并将其表述为一阶线性多元回归问题,具体步骤如下:
1. 输出分配 :为每个 k 维特征向量 Xi 分配输出 c(i),规则如下:
[
c(i) =
\begin{cases}
c1, & \text{if } i \in \text{class1} \
c2, & \text{if } i \in \text{class2}
\end{cases}
]
其中,class 1 代表男性,class 2 代表女性,k 表示特征的维度。
2. 判别得分计算 :使用回归方程计算特征向量
语音性别识别与云系统技术解析
超级会员免费看
订阅专栏 解锁全文
1310

被折叠的 条评论
为什么被折叠?



