孟加拉语手写字符识别与开源语音命令人机交互系统研究
1. 孟加拉语手写字符识别
1.1 模型优化公式
在孟加拉语手写字符识别中,模型的权重更新公式如下:
[
w_{t + 1} = w_t - \frac{\alpha}{\sqrt{\hat{v} t + \epsilon}}(\beta_1 \hat{m}_t + \frac{1 - \beta_1}{1 - \beta_1^t} \cdot \frac{\partial L}{\partial w_t})
]
其中:
- (\hat{m}_t = \frac{m_t}{1 - \beta_1^t})
- (\hat{v}_t = \frac{v_t}{1 - \beta_2^t})
- (m_t = \beta_1 m {t - 1} + (1 - \beta_1) \frac{\partial L}{\partial w_t})
- (v_t = \beta_2 v_{t - 1} + (1 - \beta_2)[\frac{\partial L}{\partial w_t}]^2)
这些公式用于优化模型的权重,使得模型在训练过程中能够不断调整以提高识别准确率。
1.2 模型架构
提出的模型是两个预训练的卷积神经网络(CNN)模型VGG - 16和DenseNet - 121的分支组合。具体架构如下:
1. 先将VGG - 16和DenseNet - 121进行拼接。
2. 依次添加一个Dropout层、一个全连接层和另一个Dropout层。这两个Drop
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



