阿萨姆语自然场景文本实时检测与定向钻井井型设计应用开发
1. 阿萨姆语自然场景文本实时检测
1.1 图像标注
在图像标注环节,使用开源的LabelImg软件对图像中的阿萨姆语文本区域进行标注。标注后的图像和对应的真实值(ground truth)会存储在同一个文件夹中。真实值以.txt文件形式呈现,包含类别编号和边界框坐标。数据集的标注采用COCO数据集格式,且为单类别标注。
1.2 超参数优化
在模型中使用了以下优化器:
- 随机梯度下降优化器(Stochastic gradient descent optimizer) :用于优化训练迭代过程,降低损失函数。它是梯度下降优化的随机近似,用随机子集数据计算的梯度估计值替代全量数据的实际梯度,降低了处理成本,但收敛速度较慢,尤其在高维优化问题中。
- Adam优化器(Adam Optimizer) :自适应矩估计优化器,适用于处理大量数据和参数的问题。它结合了带动量的梯度下降和“RMSP”算法,计算效率高,内存负担小。
在Google Colab上训练YOLOv3时,参数设置如下:
- 动量(momentum):0.9
- 初始学习率(initial learning rate):0.0001
- 衰减(decay):0.0005,用于在训练的前1000次迭代中稳定网络
- 最大批次(maximum batches):类别数×2000 = 1×2000 = 2000,即训练2000次迭代后停止
- 类别(classes):1
-
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



