58、用于焊接质量监测的字面感知知识图谱嵌入技术

用于焊接质量监测的字面感知知识图谱嵌入技术

1. 模型设置

1.1 嵌入大小选择

基于验证集上的平均倒数排名(MRR),选择 128 或 256 作为效率和准确性之间的最佳折衷。对于 KGE - MLP 模型,在搜索空间 {16, 32, 64, 128, 256} 上对嵌入大小进行实验,最终选择 128 作为效率和准确性的最佳折衷。

1.2 KGE - MLP 模型测试

KGE - MLP 模型的特殊变体使用 TransE、DistMult 和 HolE 进行测试。

2. 结果与讨论

2.1 问题 1 的结果与讨论

模型 Acc(Hits@1) MRR nrmse 训练时间 测试时间
TransE 0.42 0.65 0.06 相对较短(KGE 中最短) 与其他模型相当
MLP 0.39 - 0.05 远小于 KGE 模型 与其他模型相当
RotatE - - - - -
AttH - 0.57 与 MLP 相当 - -
  • Acc(Hits@1) :对于问题 1,Hits@1 表示正确预测的直径类别的百分比,代表直径预测的准确性。TransE 在这方面表现最佳,比 MLP 高 6%,但 0.42 的准确率对于工业应用来说仍不足,工业应用通常期望至少 80% 的准确率,90% 以上才是理想的。MLP 模型在直径类别预测的 Hits@1 指标上表现不佳,准确率仅为 0.39。其他两个 KGE 模型 RotatE 和 AttH 与 MLP 相比没有明显改进,但仍能正确预测约 1/4 的直径类别。
  • MRR :对于常见的 KGE 问题,MRR 是一个重要的性能指标,且与 Hits@1 高度相关。在该用例中,TransE 的 MRR 为 0.65,是最佳的 KGE 模型,AttH 以 0.57 位居第二。MLP 没有 MRR 值,因此在这方面无法与 KGE 模型比较。
  • nrmse :nrmse 通过将直径类别转换回实际值,然后使用公式 Σi(Di - ˆDi)² / ¯D 计算得出,它表示平均预测误差相对于预测目标均值的归一化值,可理解为相对百分比误差。MLP 模型在 nrmse 方面表现最佳,TransE 和 AttH 与 MLP 相当,预测误差在 5% - 6% 之间。这可能是因为直径预测原本是一个回归问题,而经典的 ML 方法如 MLP 更适合回归问题。
  • 时间 :在训练时间方面,MLP 消耗的时间远少于所有 KGE 模型,而 TransE 在 KGE 模型中消耗的时间最少。在测试时间方面,所有模型相当。对于训练时间关键的工业应用,MLP 具有优势;而在大多数情况下,工业应用中的模型是预训练的,测试时间更为重要,此时所有模型在测试时间上都没有采用问题。

2.2 问题 2 的结果与讨论

模型 Acc(Hits@1) MRR Hits@Groupby3 训练时间 测试时间
TransE 0.64 0.77 0.85 相对较短(KGE 中最短) 与其他模型相当
MLP 0.61 - - 远小于 KGE 模型 与其他模型相当
  • Acc(Hits@1) :该指标表示正确预测的车身部件的百分比。TransE 是最佳模型,比 MLP 模型高 5%(相对)。对于车身部件问题,可将其视为分类问题,TransE 更适合。但 0.61 的预测准确率对于工业应用来说仍然不足,可考虑放宽预测要求,依赖 Hits@Groupby3 指标。
  • MRR :与问题 1 类似,MRR 与 Hits@1 高度相关,TransE 是最佳的 KGE 模型。
  • Hits@Groupby3 :这是一个新提出的指标,类似于 Hits@3。它通过将车身部件分成每组 3 个的组,然后计算预测的车身部件是否在该组内。该指标放宽了预测要求,在工业实践中可将车身部件组作为质量监测的最小单位。所有 KGE 模型在该指标上表现较好,约为 0.80,TransE 仍然是最佳模型,准确率为 0.85。
  • 时间 :训练时间方面,MLP 消耗的时间远少于所有 KGE 模型,TransE 在 KGE 模型中消耗的时间最少。测试时间方面,所有模型相当。对于训练时间关键的情况,MLP 有优势;对于仅进行推理的情况,性能更高的 TransE 更具优势。在测试时间方面,所有模型都没有采用问题。

2.3 KGE - MLP 模型比较

指标 TransE TransE* DistMult* HolE*
Acc(Hits@1)(Q1) 0.42 0.17 0.22 0.21
MRR(Q1) 0.65 0.45 0.48 0.48
nrmse(Q1) 0.06 0.11 0.09 0.10
Hits@1(Q2) 0.64 0.34 0.34 0.37
MRR(Q2) 0.77 0.48 0.52 0.41
Hits@GroupBy3(Q2) 0.85 0.45 0.46 0.52

从表中可以看出,所有 KGE - MLP 变体在 Acc(Hits@1)、MRR 和 nrmse 方面的表现都比其对应的 KGE 模型差。基于 DistMult 的 MLP 模型在车身预测方面相对于基线 MLP 模型没有表现出性能提升,可能是因为该模型中的 MLP 无法很好地捕捉焊接信息。这些特殊的 KGE 变体可能适用于其他问题,但似乎不太适合本用例中的问题。

2.4 字面量的消融研究

模型 Acc(Hits@1)(Q1) nrmse(Q1) MRR(Q1) Hits@1(Q2) MRR(Q2) Hits@GroupBy3(Q2)
TransE 0.42 0.06 0.64 0.64 0.77 0.85
MLP 0.39 0.05 - 0.61 - -
TransE† 0.45 0.04 0.68 0.53 0.70 0.78
MLP† 0.36 0.05 - 0.49 - -

从消融研究结果可以看出,对于回答问题 1,TransE 没有字面量时(TransE†)的性能比有字面量时更好,而 MLP 有字面量时表现更好。对于回答问题 2,没有字面量时,MLP 和 TransE 模型的性能都有所下降。这可能是因为直径类在知识图谱中是孤立的,使得 TransE 难以学习直径和焊点之间的正确链接;而车身部件在知识图谱中通过许多其他链接与其他部分“良好”连接,因此没有字面量时性能下降。

2.5 工业应用建议

  • 对于问题 1,MLP 在 nrmse 方面比 TransE 略好,但 5% 和 6% 的误差差异较小。考虑到 MLP 训练时间更短,且对于领域专家来说更容易理解,因此在回答问题 1 时,MLP 更受青睐。
  • 对于问题 2,TransE 的结果比 MLP 好。虽然考虑预测准确率(Hits@1)时,两种方法都不能直接应用于工业,但通过引入 Hits@Groupby3 指标放宽条件后,情况有所改善。车身分类问题对于经典 ML 来说具有挑战性,因为标签类别数量较多,因此引入新指标对于工业应用是个好消息。总体而言,KGE 在工业应用中的可采用性是有前景的,尽管并不完美。通过问题表述的调整、数值字面量的处理和新指标的引入,可采用性得到了提高。
graph LR
    A[选择嵌入大小] --> B[测试 KGE - MLP 模型]
    B --> C{问题 1 结果分析}
    B --> D{问题 2 结果分析}
    C --> E[比较 KGE - MLP 模型]
    C --> F[字面量消融研究]
    D --> E
    D --> F
    E --> G[给出工业应用建议]
    F --> G

3. 一般影响与相关工作讨论

3.1 知识图谱嵌入(KGE)的相关工作

代表性的 KGE 模型包括欧几里得空间中的平移模型,如 TransE、RotatE,以及具有注意力机制的双曲空间模型 AttH,这些模型可用于质量监测。

3.2 KGE 应用的相关工作

过去,KGE 在自然语言处理、生态毒理学效应预测、生物领域等有一些实际应用。但在工业应用方面的工作相对较少。本研究尝试测试 KGE 在工业,特别是制造业等传统行业(而非互联网行业)中的应用程度。

3.3 利益相关者的可用性

本研究属于博世数据驱动的制造条件监测解决方案研究项目,采用神经符号方法的新一代制造监测解决方案框架。该项目涵盖三个子项目:电阻点焊质量监测、热铆接工艺优化和塑料数据分析。项目与德国的几家工厂合作,旨在实现智能设备分析、工艺优化等。目前,该解决方案正在博世研究部门和工厂的评估环境中进行评估,并获得了数据科学家、语义专家、研发工程师等利益相关者的积极反馈。经过评估和原型制作后,解决方案将应用于工厂。

3.4 广泛采用

研究团队在开放的 GitHub 存储库中提供了机器学习(ML)和 KGE 的脚本以及匿名化的焊接知识图谱数据集,这些资源有助于复现研究方法和结果。目标是促进将语义技术和 ML 相结合的神经符号研究在工业应用中的发展,特别是制造业。希望这些资源能激发神经符号推理、语义技术、图嵌入等领域的研究,推动这些领域的技术进步。同时,由于大多数开源知识图谱数据集是关于常识领域的,而关于制造业等行业的数据集较少,因此希望该数据集能帮助更多研究人员将知识图谱研究与工业案例相结合。

3.5 可扩展性和效益

测试结果表明,对于工业可扩展性至关重要的测试时间是可以接受的。该研究的效益明显,数据驱动的解决方案有助于降低成本和浪费,提高质量监测的覆盖范围,减少或最终取代传统的破坏性检测方法(如破坏焊接车身样本)。此外,该研究是制造业神经符号推理的一次尝试,有望激发更多的研究方向。

3.6 风险和机会

研究存在一定风险,即直径和车身部件的预测并不完美。如果该技术应用于质量监测系统,需要在系统中记录这些风险。不过,这些风险与传统方法和其他数据驱动解决方案相当,并且可以通过正确理解预测结果和采取安全系数等措施来管理。该研究也为进一步研究和改进其他制造条件监测问题、数据集和用例的解决方案提供了机会,同时为从事工业数字化和人工智能应用的研究人员提供了机遇。

4. 结论与展望

本研究探讨了知识图谱嵌入(KGE)在博世焊接质量监测中的应用程度。将 KGE 方法与多层感知器(MLP)在制造质量监测的两个重要问题上进行了比较。为使 KGE 适用于工业问题,在以下方面对 KGE 方法进行了调整:
1. 将经典的机器学习分类和回归问题转化为链接预测问题。
2. 提出处理字面量(包括传感器测量值和直径)的策略。
3. 引入性能指标均方根误差(rmse)和 Hits@GroupBy3。

如果仅考虑 KGE 的原始指标(如 Hits@1 和 MRR),KGE 不能直接应用,但通过采用 rmse 和 Hits@GroupBy3 放宽预测任务后,KGE 的可采用性得到提高,并给出了应用建议。

本研究属于博世的工业 4.0 神经符号人工智能框架,旨在通过符号人工智能(如语义技术)提高透明度,通过机器学习提高预测能力。未来,计划研究更大的数据集,提高 KGE 的性能,并与工厂同事密切合作,进一步研究该技术的可采用性。

graph LR
    A[相关工作研究] --> B[评估利益相关者可用性]
    B --> C[促进广泛采用]
    C --> D[测试可扩展性与效益]
    D --> E[分析风险与机会]
    E --> F[得出结论与展望未来]

综上所述,KGE 在工业应用中的潜力巨大,但仍需进一步研究和改进。通过不断优化模型和引入新指标,有望提高 KGE 在工业制造质量监测等领域的应用效果,为传统制造业的智能化升级提供有力支持。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值