离线乌尔都语手写识别与分布式视频监控系统目标匹配研究
1. 乌尔都语手写识别数据库构建
乌尔都语的书写形式比阿拉伯语和波斯语更为复杂,这使得构建用于手写识别的乌尔都语数据库十分必要。整个研究围绕该数据库的构建、处理及实验展开。
1.1 数据收集
- 表格设计 :设计了两页的数据录入表格用于收集手写数据。第一页包含20个印度孤立数字(每个数字两个样本)、自由书写的日期、38个不同长度的数字字符串、43个孤立字符和16个单词;第二页包含其余41个单词和5个特殊符号。
- 收集地点 :数据收集工作在加拿大蒙特利尔(占30%)和巴基斯坦(占70%)进行。
- 书写者信息 :收集了343位不同书写者的手写样本,涵盖不同职业背景、资质和年龄的男女。记录了书写者的性别、年龄以及左右手习惯,其中右利男性占75.4%,左利男性占5.6%,右利女性占19.0%,左利书写者数量远少于右利者。
| 书写者类型 | 占比 |
|---|---|
| 右利男性 | 75.4% |
| 左利男性 | 5.6% |
| 右利女性 | 19.0% |
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



