文档图像语言分类与植物表型分析技术研究
1. 文档图像语言分类技术
1.1 特征提取方案
在文档图像语言分类领域,有多种特征提取方法,其特征向量大小各有不同,具体如下表所示:
|序号|特征提取方法|特征向量大小|
| ---- | ---- | ---- |
|1|旋转不变局部二值模式(Rotation invariant LBP)|640|
|2|方向梯度直方图特征(HOG features)|324|
|3|多分辨率HOG特征(Multi - resolution HOG features (DWT + HOG))|256|
|4|64×64单元大小的提出特征(Proposed features with 64 × 64 cell size)|1296|
|5|128×128单元大小的提出特征(Proposed features with 128 × 128 cell size)|144|
从这些数据可以推测,不同的特征提取方法所产生的特征向量大小差异较大,这可能会影响后续分类器的处理效率和分类效果。例如,特征向量越大,可能包含的信息越丰富,但也可能增加计算复杂度。
1.2 分类器对比结果
使用K - NN和SVM两种分类器对提出的特征进行测试,在包含卡纳达语、马拉地语、泰卢固语、印地语和英语五种语言的1006个文档图像数据库上进行实验,结果如下:
K - NN分类器结果
| 序号 | 语言 | 旋转不变局部二值模式( |
|---|
超级会员免费看
订阅专栏 解锁全文
295

被折叠的 条评论
为什么被折叠?



