深度学习在日语草书识别与历史小提琴风格分类中的应用
深度学习在日语草书识别中的应用
数据增强与模型训练
在创建日语草书(Kuzushiji)检测模型时,会使用一些方法来增强数据。对于字符分类,会结合三种基于ResNet的模型的结果并输出,这些模型也是使用伪标签进行训练的。在创建字符分类模型时,采用水平移动、旋转、缩放和随机擦除等方式进行数据增强。
检测与分类模型的选择
总结顶尖团队的方法,可以发现利用最近提出的检测和分类模型很重要。但无法确定单阶段还是两阶段方法能取得更好的结果。在检测方法方面,像在目标检测中常用的YOLO模型表现不佳,而Faster R - CNN和CenterNet则取得了成功。原因在于图像中的字符几乎没有重叠,这与传统目标检测不同。一些团队使用具有强大骨干网络的最新模型提高了准确率,而另一些团队则认为自己的方法更成功。
相关活动
- 研讨会 :2019年11月举办了“2019日本文化与人工智能研讨会”,介绍了全球范围内关于日语草书的前沿研究,参与者探讨了过去和现在的研究,旨在推动利用人工智能进行日语草书阅读和理解的未来研究。
- 项目 :“Cloud Honkoku(云转录)”项目实现了一个允许纠正其他参与者转录结果的系统。通过与使用KuLA和人工智能技术的日语草书学习应用程序合作,简化并提高了参与者开发方法的效率,转录结果还可作为训练数据。
- 在线服务 :CODH提供了多项在线服务,如KuroNet日语草书字符识别服务、K
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



