DeepLearningTool-深度学习分类-和HALCON的详细过程

桌上有盆长寿花

已于 2025-03-04 22:11:39 修改

阅读量1.9k

点赞数 25

分类专栏：深度学习文章标签：深度学习

于 2025-03-04 22:09:01 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_36672036/article/details/146026772

版权

深度学习专栏收录该内容

10 篇文章

订阅专栏

因二维码划伤在码内部，可以识别二维码，用二维码的固定损坏等级，来判断，要么过检测，要么，漏检测。所以考虑用深度学习。测试后，深度学习可用，但是耗时较长。深度学习弃用。

具体描述halcon深度学习分类的实现过程：
首先需要用自带的MVTEC DEEPLEARNING TOOL来标注训练得到模型。具体做法如下:
需要提前准备的工作：
有图像，有dlt工具

点击图标:
目前自用版本是24.12

点击新建项目

添加图片：这里已经将OK和NG分好分别放在两个文件夹
在这里插入图片描述

文件图路径

可以更改OK/NG类型

设好所有参数
点击开始训练

评估

AI2性能更强大一些。
导出：

如何使用：
在halcon
以下是使用说明：

*关闭程序计数器
dev_update_pc ('off')
*开启或关闭程序运行过程中变量窗口的更新
dev_update_var ('off')
dev_update_window ('off')
dev_close_window ()
dev_open_window (0, 0, 202, 202, 'black', WindowHandle)
*在此处输入/调整名称和路径

* 
*读取阀值和图像预处理参数。
read_dict ('E:/2025yearproject/2Project_BarCode20250217/DL-CODE/model_训练-250304-212226_opt_dl_preprocess_params.hdict',\
           [], [], DLPreprocessParam)
*读入学习的网络模版及权重
read_dl_model ('E:/2025yearproject/2Project_BarCode20250217/DL-CODE/model_训练-250304-212226_opt.hdl',\
DLModelHandle)
*请选择CPU设备。
query_available_dl_devices (['runtime', 'runtime'], ['gpu', 'cpu'], DLDeviceHandles)
if (|DLDeviceHandles| == 0)
    throw ('No supported device found to continue this example.')
endif
*由于query_available_dl_devices中使用的筛选器，第一个设备是GPU（如果可用）。
DLDevice := DLDeviceHandles[0]
* 
*使用的批处理大小
set_dl_model_param (DLModelHandle, 'device', DLDevice)

    query_font (WindowHandle, Font)
    * Specify font name and size
    FontWithSize := Font[0]+'-20'
    set_font (WindowHandle, FontWithSize)
*将DLT中的训练模型随机应用于一些
*选择的示例图像。

create_dict (DLSample)
* Image Acquisition 01: Code generated by Image Acquisition 01
list_files ('E:/DATACODE', ['files','follow_links','recursive'], ImageFiles)
tuple_regexp_select (ImageFiles, ['\\.(tif|tiff|gif|bmp|jpg|jpeg|jp2|png|pcx|pgm|ppm|pbm|xwd|ima|hobj)$','ignore_case'], ImageFiles)
for Index := 0 to |ImageFiles| - 1 by 1
    read_image (Image, ImageFiles[Index])
    *把图像装入字典
    set_dict_object (Image, DLSample, 'image')
    *格式化图片使其和训练的一样，异常判断还是种类选择，图像大小，通道数，色彩范围，归一化，查找范围
    preprocess_dl_samples (DLSample, DLPreprocessParam)
    *对预处理后的图像进行判断
    apply_dl_model (DLModelHandle, DLSample, [], DLResult)
    *用学习过的阈值推断结果。
    *写出结果
    dev_display (Image)
    result:=DLResult.classification_class_names[0]
    if(result=='OK')
        set_color (WindowHandle, 'green')
    else
        set_color (WindowHandle, 'red')
    endif
    set_tposition (WindowHandle, 24, 12)
    write_string (WindowHandle, 'Result: ' + DLResult.classification_class_names[0])
    wait_seconds (0.5)
*     stop()
endfor

损失函数（Loss Function）

定义：损失函数用于衡量模型预测值与真实值之间的差异，是模型优化的目标。

作用：

模型训练：通过最小化损失函数来优化模型参数。
性能评估：评估模型在训练集和测试集上的表现。

常见类型：

均方误差（MSE）：用于回归问题，计算预测值与真实值的平方差均值。
交叉熵损失（Cross-Entropy Loss）：用于分类问题，衡量预测概率分布与真实分布的差异。
对数损失（Log Loss）：二分类问题的交叉熵损失。
Hinge Loss：用于支持向量机（SVM），适用于分类问题。

公式：

MSE：( \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 )
交叉熵损失：( \text{Cross-Entropy} = -\sum_{i=1}^{n} y_i \log(\hat{y}_i) )

混淆矩阵（Confusion Matrix）

定义：混淆矩阵用于分类问题，展示模型预测结果与真实标签的对比。

结构：

真正例（True Positive, TP）：正确预测为正类。
假正例（False Positive, FP）：错误预测为正类。
真反例（True Negative, TN）：正确预测为负类。
假反例（False Negative, FN）：错误预测为负类。

作用：

性能评估：计算准确率、召回率、F1分数等指标。
错误分析：识别模型在哪些类别上表现不佳。

常见指标：

准确率（Accuracy）：( \frac{TP + TN}{TP + FP + TN + FN} )
精确率（Precision）：( \frac{TP}{TP + FP} )
召回率（Recall）：( \frac{TP}{TP + FN} )
F1分数（F1 Score）：( 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} )