文字识别
文章平均质量分 69
Coding的叶子
AI大模型、三维感知算法、计算机视觉算法、量化算法等长期研究与分享。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
解决PaddleOCR PP-OCRv5推理结果为空等问题记录
本文总结了使用PaddleOCR工具(PP-OCRv5模型)时常见的三个问题及解决方案:1)属性错误"_pp_option不存在"可通过降级至3.2.0版本并清除缓存解决;2)"无有效模型"报错需删除~/.paddlex/目录重新下载模型;3)推理结果为空问题主要源于paddlepaddle-gpu与CUDA版本不兼容,建议从官网获取适配版本的安装包。文中提供了详细的解决步骤和代码示例,帮助用户快速排查和解决使用PaddleOCR时的常见障碍。原创 2025-11-05 14:20:25 · 1270 阅读 · 0 评论 -
CRNN文字识别
要点:CNN+RNN+CTCCNN:通过卷积操作,将h x w x c图像转换为1xTxC特征图。1为特征图的高,T为特征图的宽,C为特征图的通道数。以高度为32的特征图来说,出卷积层为,用4层池化层可将高度降低到2,再用一个核为2、pad为0的卷积即可将高度降为1。RNN:RNN一般采用两层的双向LSTM,输入的序列长度为CNN卷积后特征的长度T,序列中每一个特征尺度为CNN卷积后的通道数C。那么,(1)第一层LSTM输入数据的维度为(T,N,C),N为batchsize大小。第一层LSTM的原创 2021-07-15 10:25:47 · 2780 阅读 · 0 评论
分享