因二维码划伤在码内部,可以识别二维码,用二维码的固定损坏等级,来判断,要么过检测,要么,漏检测。所以考虑用深度学习。测试后,深度学习可用,但是耗时较长。深度学习弃用。
具体描述halcon深度学习分类的实现过程:
首先需要用自带的MVTEC DEEPLEARNING TOOL来标注训练得到模型。具体做法如下:
需要提前准备的工作:
有图像,有dlt工具
点击图标:
目前自用版本是24.12
点击新建项目
添加图片:这里已经将OK和NG分好分别放在两个文件夹
文件图路径
可以更改OK/NG类型
设好所有参数
点击开始训练
评估
AI2性能更强大一些。
导出:
如何使用:
在halcon
以下是使用说明:
*关闭程序计数器
dev_update_pc ('off')
*开启或关闭程序运行过程中变量窗口的更新
dev_update_var ('off')
dev_update_window ('off')
dev_close_window ()
dev_open_window (0, 0, 202, 202, 'black', WindowHandle)
*在此处输入/调整名称和路径
*
*读取阀值和图像预处理参数。
read_dict ('E:/2025yearproject/2Project_BarCode20250217/DL-CODE/model_训练-250304-212226_opt_dl_preprocess_params.hdict',\
[], [], DLPreprocessParam)
*读入学习的网络模版及权重
read_dl_model ('E:/2025yearproject/2Project_BarCode20250217/DL-CODE/model_训练-250304-212226_opt.hdl',\
DLModelHandle)
*请选择CPU设备。
query_available_dl_devices (['runtime', 'runtime'], ['gpu', 'cpu'], DLDeviceHandles)
if (|DLDeviceHandles| == 0)
throw ('No supported device found to continue this example.')
endif
*由于query_available_dl_devices中使用的筛选器,第一个设备是GPU(如果可用)。
DLDevice := DLDeviceHandles[0]
*
*使用的批处理大小
set_dl_model_param (DLModelHandle, 'device', DLDevice)
query_font (WindowHandle, Font)
* Specify font name and size
FontWithSize := Font[0]+'-20'
set_font (WindowHandle, FontWithSize)
*将DLT中的训练模型随机应用于一些
*选择的示例图像。
create_dict (DLSample)
* Image Acquisition 01: Code generated by Image Acquisition 01
list_files ('E:/DATACODE', ['files','follow_links','recursive'], ImageFiles)
tuple_regexp_select (ImageFiles, ['\\.(tif|tiff|gif|bmp|jpg|jpeg|jp2|png|pcx|pgm|ppm|pbm|xwd|ima|hobj)$','ignore_case'], ImageFiles)
for Index := 0 to |ImageFiles| - 1 by 1
read_image (Image, ImageFiles[Index])
*把图像装入字典
set_dict_object (Image, DLSample, 'image')
*格式化图片使其和训练的一样,异常判断还是种类选择,图像大小,通道数,色彩范围,归一化,查找范围
preprocess_dl_samples (DLSample, DLPreprocessParam)
*对预处理后的图像进行判断
apply_dl_model (DLModelHandle, DLSample, [], DLResult)
*用学习过的阈值推断结果。
*写出结果
dev_display (Image)
result:=DLResult.classification_class_names[0]
if(result=='OK')
set_color (WindowHandle, 'green')
else
set_color (WindowHandle, 'red')
endif
set_tposition (WindowHandle, 24, 12)
write_string (WindowHandle, 'Result: ' + DLResult.classification_class_names[0])
wait_seconds (0.5)
* stop()
endfor
损失函数(Loss Function)
定义:损失函数用于衡量模型预测值与真实值之间的差异,是模型优化的目标。
作用:
- 模型训练:通过最小化损失函数来优化模型参数。
- 性能评估:评估模型在训练集和测试集上的表现。
常见类型:
- 均方误差(MSE):用于回归问题,计算预测值与真实值的平方差均值。
- 交叉熵损失(Cross-Entropy Loss):用于分类问题,衡量预测概率分布与真实分布的差异。
- 对数损失(Log Loss):二分类问题的交叉熵损失。
- Hinge Loss:用于支持向量机(SVM),适用于分类问题。
公式:
- MSE:( \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 )
- 交叉熵损失:( \text{Cross-Entropy} = -\sum_{i=1}^{n} y_i \log(\hat{y}_i) )
混淆矩阵(Confusion Matrix)
定义:混淆矩阵用于分类问题,展示模型预测结果与真实标签的对比。
结构:
- 真正例(True Positive, TP):正确预测为正类。
- 假正例(False Positive, FP):错误预测为正类。
- 真反例(True Negative, TN):正确预测为负类。
- 假反例(False Negative, FN):错误预测为负类。
作用:
- 性能评估:计算准确率、召回率、F1分数等指标。
- 错误分析:识别模型在哪些类别上表现不佳。
常见指标:
- 准确率(Accuracy):( \frac{TP + TN}{TP + FP + TN + FN} )
- 精确率(Precision):( \frac{TP}{TP + FP} )
- 召回率(Recall):( \frac{TP}{TP + FN} )
- F1分数(F1 Score):( 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} )
总结
- 损失函数:衡量预测误差,用于模型优化。
- 混淆矩阵:评估分类模型性能,提供详细预测结果分析。
两者结合使用,可以全面评估和优化模型。
过拟合(Overfitting)
定义:模型在训练集上表现很好,但在测试集或新数据上表现较差,通常是因为模型过于复杂,捕捉了训练数据中的噪声。
表现:
- 训练集误差低,测试集误差高。
- 模型对训练数据过于敏感。
原因:
- 模型复杂度过高。
- 训练数据不足。
- 训练时间过长。
调整方法:
- 简化模型:
- 减少参数数量。
- 使用正则化(如L1、L2正则化)。
- 增加数据:
- 数据增强。
- 收集更多数据。
- 早停(Early Stopping):
- 在验证集误差最小时停止训练。
- 交叉验证:
- 使用交叉验证评估模型性能。
- Dropout:
- 在神经网络中随机丢弃部分神经元。
欠拟合(Underfitting)
定义:模型在训练集和测试集上表现都不佳,通常是因为模型过于简单,无法捕捉数据中的复杂模式。
表现:
- 训练集和测试集误差都高。
- 模型对数据拟合不足。
原因:
- 模型复杂度过低。
- 特征选择不当。
- 训练时间不足。
调整方法:
- 增加模型复杂度:
- 增加参数数量。
- 使用更复杂的模型(如深层神经网络)。
- 特征工程:
- 添加更多特征。
- 使用特征选择方法。
- 增加训练时间:
- 增加训练轮数(epochs)。
- 调整学习率:
- 使用更小的学习率,使模型更细致地学习数据。
- 集成方法:
- 使用集成学习(如随机森林、梯度提升)。
总结
- 过拟合:模型过于复杂,捕捉了噪声,表现为训练集误差低,测试集误差高。
- 欠拟合:模型过于简单,无法捕捉数据模式,表现为训练集和测试集误差都高。
调整参数:
- 过拟合:简化模型、增加数据、使用正则化、早停、Dropout。
- 欠拟合:增加模型复杂度、特征工程、增加训练时间、调整学习率、使用集成方法。
通过合理调整参数和方法,可以有效避免过拟合和欠拟合,提升模型性能。