基于图像的操作分类与FPGA道路裂缝检测技术解析
基于图像的方法 - 时间测量操作分类
在数据处理方面,其依据Rückert和Papenberg的研究成果开展。在训练算法前处理数据时,会从相应文件夹中提取图像数据,并按照他们开发的算法进行读取。接着,数据集会进一步划分为训练集、验证集和测试集,按照60:20:20的原则随机划分,即60%的数据分配给训练集,验证集和测试集各占20%。每次开始训练时,数据集都会重新分配,这就导致相同起始参数多次训练时,准确率会出现偏差。每次运行时,数据集的分布会保存在相应数据文件中,以便追踪子集的分布情况。之后,红外图像会被缩小到384 × 318像素,即原始尺寸的四分之三,目的是减少可训练的参数数量,但这会导致信息丢失。整体架构的核心是ConvLSTM2D架构,它将CNN和LSTM的优势结合到神经网络的一个公共层中,相比单独的CNN或LSTM,更适合对时空数据进行分类。
在测试场景中,会分别评估训练好的算法在数据集上对装配操作和对象分类的性能,采用准确率这一参数,并通过混淆矩阵展示各个准确率。将预测类别与实际类别进行比较,从而得出准确率的相关结论,同时计算关键指标。每次对不同类别进行训练时,会调整不同参数以获得更好的结果,包括调整或不调整学习率,修改滤波器和耐心值等变量。在对五种装配操作进行分类的训练运行中,检测装配操作的准确率达到了87.24%。
从混淆矩阵来看,训练中各装配操作的主对角线显示出良好的分类效果。例如,“到达”操作的识别率为93%,“抓取”操作的识别率为96%。不过,“搬运”操作有14%被错误预测为“定位”,这是因为在“搬运”和“定位”操作中,物体都会被放在手中,且两种操作都能识别到手的动作。“定位”操作中只有7%被归为“搬运”,1
超级会员免费看
订阅专栏 解锁全文
681

被折叠的 条评论
为什么被折叠?



