基于卷积神经网络的在线英文报纸广告检测
1. 数据集与模型训练
1.1 数据集介绍
使用英文报纸图像数据集进行实验,该数据集包含 11,000 张图像,其中广告和非广告图像各 5500 张。数据集分类如下表所示:
| 数据集 | 图像数量 |
| — | — |
| 训练用数据 | 7040 |
| 验证用数据 | 1760 |
| 测试用数据 | 2200 |
| 总计 | 11,000 |
1.2 模型训练环境
提出的卷积神经网络(CNN)模型在“Google Colab”提供的 Tesla V100 SXM2 16 GB GPU 上进行训练。训练和测试均基于上述英文报纸图像数据集,其中 80%(8800 张)的图像用于训练,20%(2200 张)用于测试。训练数据又按 80:20 的比例分为训练集(7040 张)和验证集(1760 张)。
1.3 模型评估指标
使用多种准确率指标评估提出的 CNN 模型,包括混淆矩阵、准确率曲线,以及一维指标如精确率、召回率和 F1 分数。各指标计算公式如下:
- 精确率 :$Precision = \frac{Number\ of\ True\ Positives}{Number\ of\ True\ Positives + Number\ of\ False\ Positives}$
- 召回率 :$Recall = \frac{Number\ of\ True\ Positives}{Number\ of\ T
超级会员免费看
订阅专栏 解锁全文
4728

被折叠的 条评论
为什么被折叠?



