图像与语音处理技术的实验与应用
在当今的信息技术领域,图像和语音处理技术是研究的热点。下面将为大家介绍图像特征归一化、越南语语音音调合成以及面部图像验证考勤管理系统等方面的技术内容。
1. 图像特征归一化实验
在图像检索系统(CBIR)的性能评估中,使用了Corel10 K和Oliva两个标准数据集。
- 数据集介绍
- Corel10 K :是Corel照片库数据库的子集,包含10000张图像,分为100层,每层100张图像。
- Oliva :包含2600张图像,分为8个类别,如海岸与海滩、开阔乡村、森林、山脉、高速公路街道、市中心、高楼等,每个类别有260 - 409张图像。
- 特征描述与处理
- 使用了五种全局特征来描述图像,分别是颜色矩(Color Moments)、局部二值模式(LBP)、Gabor小波纹理(Gabor Wavelets Texture)、边缘(Edge)和GIST。
- 所有特征都进行了归一化处理,使每个向量分量在[-1, 1]范围内,然后再归一化到[0, 1],采用欧几里得距离计算特征向量之间的距离。
- 实验对比
- 使用EMR算法评估3r - opt和3r - FCM算法的有效性。
- 实验结果表明,在Corel10 K和Oliva数据集上,3r - opt的平均准确率均高于3r - FCM,具体数据如下表所示:
| 图像数据集 | 3r - FCM平均准确率 | 3r - o
超级会员免费看
订阅专栏 解锁全文
1331

被折叠的 条评论
为什么被折叠?



