牙科铣削参数优化与图像分割的混合系统研究
1. 牙科铣削参数优化
在牙科零件制造的案例研究中,遗传算法(GA)用于获取能最佳优化时间误差的变量。优化过程从一组随机生成的解决方案(即种群 - 染色体)开始,然后通过上一步获得的适应度函数(制造系统的人工神经网络(ANN)模型)对种群中的每个个体进行评估。本研究中使用的 GA 以及不同类型的遗传算子(选择、交叉、变异)均在 Matlab© 中实现。
1.1 实验与结果
为了选择能最好描述与制造时间误差关系的特征,对实际工业用例进行了分析。CMLHL 是一种强大的识别内部数据集结构的技术。投影的轴(图 2.a 和图 2.b)代表原始数据集中变量的组合。PCA 模型寻找方差最大的方向,而 CMLHL 寻找能衡量维度/方向有趣程度的方向,即尽可能不呈高斯分布的方向(通过分析峰度)。
从图 2 可以看出,PCA(图 2.a)和 CMLHL(图 2.b)都在数据集中发现了清晰的内部结构,两种方法都将“半径”和“RPM”变量识别为相关变量。CMLHL 投影提供了更多信息,因为它还识别出“厚度”和“实际工作时间”为重要变量,并且 CMLHL 比 PCA 模型提供了更稀疏的表示。
对 CMLHL 模型结果的分析表明,它识别出了按“半径”和“RPM”变量排序的几个不同聚类。在每个聚类内部,还可以根据“厚度”和“实际工作时间”进一步分类,数据集具有有趣的内部结构。
当数据集被认为具有足够的信息时,就开始通过应用几种传统的 ANN 建模系统来建模输入与生产时间误差之间的关系。使用 ANN 来监测牙科零件制造中的时间误差检测,具体步骤如下:
1. 对输入和输出进行归一化处理(零均值和单位标准差)。
2. 降低输入向量的维度。
3. 使用提前停止和贝叶斯正则化技术。
模型是根据贝叶斯正则化准则获得的,当 ANN 确定最后一步开始时,该模型将用作 GA 中的适应度函数。ANN 结构(前馈网络)具有 25 个双曲正切单元(第 1 层)、20 个隐藏双曲正切单元(第 2 层)、4 个隐藏双曲正切单元(第 3 层)和 1 个线性输出单元,网络使用 Lenvenberg - Marquardt 方法进行估计,模型指标为 FIT1: 80.1%,V: 0.043,NSSE1: 0.031。
适应度函数是牙科零件制造中时间误差的模型。GA 从随机生成的大小为 60 个个体的初始种群开始,使用锦标赛选择来确定下一代的父代。当前种群中的个体根据其适应度成比例选择,形成下一代的基础。两点交叉将两个父代组合成下一代的新个体,以 0.01 的速率进行均匀变异,使种群中的个体发生小的变化。通过这些遗传修改获得的种群根据适应度函数进行评估,并进入下一代的新搜索过程。算法在达到固定的代数后停止,并返回最佳个体作为给定问题的解决方案。
图 3 显示了不同未归一化输入变量范围下时间误差的输出响应。
在图 3.a 中,X 轴表示厚度(8mm 至 18mm),Y 轴表示每分钟转数(10,000 至 38,000 RPM),Z 轴表示未归一化的输出变量范围(-400 至 0 秒),半径固定为 1.5mm,时间误差也显示在条形图上。在图 3.b 中,X 轴表示厚度(8 至 18mm),Y 轴表示半径(0.25 至 2mm),Z 轴表示未归一化的输出变量范围(-250 至 0 秒),每分钟转数固定为 22,000 RPM,时间误差同样显示在条形图上。可以针对不同的半径、厚度和每分钟转数值优化时间误差。例如,对于厚度为 14mm 和半径为 1.5mm 的情况,可以实现较小的时间误差,并找到最佳的每分钟转数值,此时时间误差为 -38.4 秒,每分钟转数为 38,000 RPM。如果半径和时间误差分别固定为 1.5mm 和 -100 秒,则优化这些变量的厚度和转数分别为 12.41mm 和 19,900 RPM。
以下是该过程的 mermaid 流程图:
graph LR
A[随机生成初始种群] --> B[评估个体适应度]
B --> C{是否达到停止条件}
C -- 否 --> D[选择父代]
D --> E[交叉操作]
E --> F[变异操作]
F --> G[生成新种群]
G --> B
C -- 是 --> H[返回最佳个体]
2. 图像分割的混合颜色距离
图像分割是图像处理和计算机视觉中的关键主题,特别是在机器人应用中。它是许多计算机视觉系统的第一步,全局过程的结果质量取决于它。文献中存在基于分水岭、聚类过程和其他特征的方法。分水岭方法基于梯度信息,通常从图像强度中获取梯度,忽略了色度信息;聚类过程完全依赖于颜色空间,因此像素较少的类可能会被错误分类。
分割结果是一个标记图像,其中每个像素属于一个类,一个类是图像中的一个连通区域。不受控制的光照、噪声和边缘检测是密切相关的问题,使用合适的距离非常重要。因此,引入了一种混合距离,它基于 RGB 颜色空间的球面解释中的二色反射模型(DRM),有助于避免阴影和高光的影响。通过这种距离,可以对噪声容限进行参数化,并且可以调整该距离以实现最佳边缘检测。
2.1 球面坐标与色度
有几项工作使用 RGB 颜色空间的球面解释来寻找光度不变量。我们关注角度参数(θ, φ)与色度 Ψ 之间的对应关系。图像像素的颜色对应于 RGB 颜色空间中的一个点 c = {Rc, Gc, Bc},该点从原点出发的向量可以用球面坐标 c = {θc, φc, lc} 表示,其中 θ 是天顶角,φ 是方位角,l 是向量的大小。在 RGB 颜色空间中,颜色点的色度 Ψc 由其归一化坐标表示,即 rc = Rc / (Rc + Gc + Bc),gc = Gc / (Rc + Gc + Bc),bc = Bc / (Rc + Gc + Bc),且 rc + gc + bc = 1。这意味着色度对应于在由 RGB 立方体顶点 {(1, 0, 0), (0, 1, 0), (0, 0, 1)} 定义的色度平面 ΠΨ 上的投影,沿着直线 Lc = {y = k·Ψc; k ∈ R}。换句话说,直线 Lc 上的所有点都具有相同的色度 Ψc,这是与颜色点的球面坐标表示的天顶角和方位角分量等效的二维表示。
给定图像 I(x) = [(R, G, B)x ; x ∈ N2],其中 x 指图像网格域中的像素坐标,我们将相应的球面表示记为 P(x) = [(φ, θ, l)x; x ∈ N2],这使我们能够使用 (φ, θ)x 作为像素颜色的色度表示。
2.2 DRM 在球面坐标中的表达
二色反射模型将图像中每个像素的感知颜色强度 I ∈ R3 解释为两个分量的总和,一个是漫反射分量 D ∈ R3,另一个是镜面反射分量 S ∈ R3。漫反射分量指观察表面的色度属性,而镜面反射分量指照明颜色。
对于具有多种表面颜色的场景,DRM 方程假设漫反射分量可能在空间上变化,而镜面反射分量在整个图像域中是恒定的。在球面坐标中表示为:
I(x) = (θD(x), φD(x), lD(x)) + (θS, φS, lS(x))
对于漫反射像素(即没有镜面反射分量的像素),天顶角 φ 和方位角 θ 几乎是恒定的,而对于镜面反射像素(即有镜面反射分量的像素),这些角度会发生变化,并且在属于不同颜色区域的漫反射像素之间会发生显著变化。因此,代表两个相邻像素 I(xp) 和 I(xq) 的向量之间的角度 ∠(Ip, Iq) 反映了它们之间的色度变化。对于同一色度区域中的两个漫反射像素,这个角度必须为 ∠(Ip, Iq) = 0,因为它们在 RGB 空间中是共线的。由于漫反射像素比镜面反射像素多得多,因此球面坐标是识别真实表面色度的最佳方法。在漫反射区域中,角度参数大致是恒定的,我们将利用这一特性进行图像分割。
以下是相关步骤的表格总结:
|步骤|描述|
|----|----|
|球面坐标转换|将 RGB 颜色空间中的点转换为球面坐标|
|DRM 表达|用球面坐标表示二色反射模型|
|边缘检测|利用角度参数进行边缘检测|
2.3 边缘与距离
当两个相邻像素具有不同属性时,图像中会出现边缘。有几种通过在图像强度上卷积导数核(如 Sobel 或 Prewitt)来实现边缘检测的方法,但这种方法会导致颜色边缘检测效果不佳,因为忽略了色度信息。可以通过使用欧几里得颜色距离或更好的混合距离来改进,所有边缘检测方法的核心都是距离的定义,通过计算相邻像素之间的距离来进行边缘测量。
在 DRM 公式中,漫反射分量可以通过角度分量 (θ, φ) 更好地描述,它们在像素色度属性相近的区域中大多是均匀的,并且与强度无关,因此在均匀色度照明的假设下与照明无关。在极端情况下,如果仅使用角度来检测边缘,黑白边界可能会被漏检,因为这两种颜色落在同一条消色差线上,因此具有相同的色度。为了解决这个问题,我们制定了一种混合距离。
图像的视觉内容取决于颜色之间的对比度以及强度对比度。如果只处理其中一个特征,会丢失很多重要信息。因此,问题是强度和色度哪个更重要,以及它们的比例应该是多少。
受人类视觉的启发,在光照较差的区域,最好使用强度;而在光照良好的区域,色度是颜色检测的主要特征。两个相邻的图像区域可能具有相同的光强度但不同的颜色,因此仅使用强度可能会漏检它们之间的边缘。另一方面,自然界中消色差表面非常丰富,区分黑白区间颜色的唯一方法是使用强度差异。综合考虑,需要同时处理色度和强度,但通过 RGB 颜色空间中的距离(如欧几里得距离)将两者结合使用并不是一个好主意,因为原点附近两点之间的欧几里得距离与对角两点之间的欧几里得距离非常不同,因为强度距离和色度距离都不是基于三维欧几里得距离的。回到人类视觉,视网膜中有两种感光细胞:视杆细胞和视锥细胞,前者是强度检测器,后者是色度检测器。
以下是图像分割过程的 mermaid 流程图:
graph LR
A[输入图像] --> B[转换为球面坐标]
B --> C[应用 DRM 模型]
C --> D[计算混合距离]
D --> E[边缘检测]
E --> F[图像分割]
F --> G[输出分割结果]
牙科铣削参数优化与图像分割的混合系统研究
2.4 混合距离的优势与应用
混合距离结合了强度和色度信息,避免了单一特征检测的局限性。在实际应用中,它能够更准确地检测图像中的边缘,尤其是在复杂光照条件下。以下是使用混合距离进行图像分割的具体步骤:
1.
数据预处理
:将输入图像转换为球面坐标表示,获取像素的角度参数 (θ, φ) 和强度信息。
2.
距离计算
:根据混合距离公式,计算相邻像素之间的距离。混合距离公式可以根据实际需求进行调整,以平衡强度和色度的权重。
3.
边缘检测
:设定一个距离阈值,当相邻像素之间的距离超过该阈值时,判定为边缘。
4.
图像分割
:根据边缘信息,将图像分割成不同的区域。
通过这种方式,可以得到更准确的图像分割结果,提高计算机视觉系统的性能。
以下是一个简单的示例,展示如何使用混合距离进行边缘检测:
import numpy as np
import cv2
# 读取图像
image = cv2.imread('example_image.jpg')
# 转换为球面坐标
# 这里需要实现具体的转换函数
# spherical_coords = convert_to_spherical(image)
# 计算混合距离
# 这里需要实现具体的混合距离计算函数
# distances = calculate_hybrid_distance(spherical_coords)
# 边缘检测
threshold = 10
edges = np.where(distances > threshold, 255, 0).astype(np.uint8)
# 显示结果
cv2.imshow('Edges', edges)
cv2.waitKey(0)
cv2.destroyAllWindows()
3. 总结与展望
本文介绍了牙科铣削参数优化和图像分割的混合系统研究。在牙科铣削参数优化方面,通过遗传算法和人工神经网络的结合,有效地降低了制造过程中的时间误差,提高了生产效率和质量。在图像分割方面,引入的混合颜色距离基于二色反射模型和球面坐标,解决了传统方法在光照、噪声和边缘检测方面的问题,提高了图像分割的准确性。
未来的研究方向可以包括:
-
牙科铣削
:进一步研究温度和侵蚀等因素对牙科铣削质量的影响,开发自动识别最佳操作条件的算法,并将模型应用于更多的金属材料和工业过程。
-
图像分割
:探索更复杂的混合距离模型,提高对复杂场景的分割能力;结合深度学习技术,进一步提升图像分割的性能。
以下是未来研究方向的列表总结:
1.
牙科铣削
- 研究温度和侵蚀对质量的影响
- 开发自动识别最佳操作条件的算法
- 应用于更多金属材料和工业过程
2.
图像分割
- 探索更复杂的混合距离模型
- 结合深度学习技术提升性能
总之,这两个领域的研究都具有重要的实际应用价值,未来的发展有望为相关行业带来更大的进步。
| 研究领域 | 未来方向 |
|---|---|
| 牙科铣削 | 研究温度和侵蚀影响、开发自动算法、应用于更多材料和过程 |
| 图像分割 | 探索复杂模型、结合深度学习技术 |
graph LR
A[牙科铣削研究] --> B[研究温度和侵蚀]
A --> C[开发自动算法]
A --> D[应用于更多材料和过程]
E[图像分割研究] --> F[探索复杂模型]
E --> G[结合深度学习技术]
超级会员免费看
17

被折叠的 条评论
为什么被折叠?



