高效的印刷泰米尔字符识别与红肉新鲜度分类方法
1. 印刷泰米尔字符识别研究
在印刷泰米尔字符识别领域,研究人员进行了一系列实验以开发鲁棒的数据集和有效的识别方法。
1.1 卷积神经网络基础
卷积神经网络(CNN)由卷积层、非线性函数(如ReLU)、池化层和全连接神经网络组成。CNN具有稀疏交互、参数共享和等变表示等属性。研究中使用了DIGI - Net架构,为适应数据集需求,对其输入大小、输出大小等进行了微调。
1.2 实验数据集与特征提取
实验使用了UJTDchar数据集和Mepco泰米尔字符数据集,训练测试比例为50:50。所有字符图像通过双三次插值调整为32×32和64×64像素。使用HOG特征描述符以4种不同方式提取特征,块大小固定为2×2,bins为9。不同单元大小和图像尺寸下提取的HOG特征数量如下表所示:
| 单元大小 | 图像尺寸64×64 | 图像尺寸32×32 |
| ---- | ---- | ---- |
| 8×8 | 1736 | 324 |
| 16×16 | 324 | 36 |
这些提取的特征使用具有3种不同核(RBF、多项式和线性)的SVM分类器进行分类。
1.3 实验结果分析
- 特征性能比较 :从64×64图像使用8×8单元大小提取的HOG特征在两个数据集上表现更好,尽管计算成本较高。324个特征的性能明显优于1736个特征,且从64×64图像提取的324个特征比从32×32图像提取的性能略好,但两者结果相近。
-1
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



