振动波形转音频播放并做声纹聚类
1、效果

2、操作流程
1.读取数据库波形数据:波形,特征,标签
2. 数据预处理流程
重采样:将低频振动数据(如1000Hz)上采样到标准音频采样率(22.05kHz)
振幅归一化:将数据缩放到[-1, 1]范围
特征提取:使用多种声学特征描述振动模式
MFCC(梅尔频率倒谱系数) - 20个系数
色度特征 - 12个音级能量
梅尔频谱 - 20个频带
频谱质心 - 频谱"重心"
过零率 - 信号穿越零点的频率
3. 特征工程优化
特征标准化:使用Z-score标准化
降维处理:PCA保留95%的方差
特征可视化:2D PCA投影展示聚类结构
4. 聚类算法选择
支持多种无监督聚类算法:
K-Means:基于距离的划分聚类
GMM(高斯混合模型):概率模型聚类
DBSCAN:基于密度的聚类(可检测噪声)
层次聚类:树状结构聚类
5. 聚类质量评估
肘部法则:寻找最佳聚类数
轮廓系数:衡量簇内紧密度和簇间分离度
Calinski-Harabasz指数:簇间方差与簇内方差的比率
6. 结果分析与解释
簇可视化:2D散点图展示聚类结果
簇分布:柱状图显示各簇样本数量
特征分析:箱线图比较各簇声学特征
代表样本:播放每簇的典型振动模式
7.验证准确率