图像分割与软管运输控制的研究进展
1. 图像分割相关内容
1.1 颜色感知与混合距离
人眼的视杆细胞和视锥细胞对激活能量的需求不同。视杆细胞所需能量少,因此在低光照条件下,人类仍能检测到强度差异;而视锥细胞需要更多能量,所以只有在光照良好时才能检测到颜色。在暗区域,强度信息更为重要;随着光照改善,色度的重要性逐渐增加。这种转变可以用色度激活函数来表示,其函数表达式如下:
[
\alpha(I) =
\begin{cases}
0 & I \leq a \
\frac{h}{2} + \cos\left(\frac{(I - a)\cdot\pi}{b - a} + \pi\right) & a < I < b \
h & I \geq b
\end{cases}
]
其中,(a)、(b)、(h) 三个参数的取值范围在 ([0, 1]) 之间。为了应用这个距离到两种颜色上,我们计算 (I = |l_{c1} - l_{c2}|/2),其中 (l_{c1}) 和 (l_{c2}) 是颜色 (c_1) 和 (c_2) 球坐标中的强度分量,也可表示为 (\alpha(c_1, c_2))。
在此基础上,可定义任意两种颜色 (c_1) 和 (c_2) 之间的混合距离:
[
d_H(c_1, c_2) = (1 - \alpha(c_1, c_2)) \cdot d_I(c_1, c_2) + \alpha(c_1, c_2) \cdot d_C(c_1, c_2)
]
其中,(d_I) 是强度距离,(d_I(c_1, c_2) = |l_{c1} - l_{c2}|);(d_C) 是色度距离,(d_C(c_1, c_2) = \sqrt{(\theta_{c1} - \theta_{c2})^2 + (\varphi_{c1} - \varphi_{c2})^2})。
1.2 图像分割算法
图像分割是将图像域集合 (F) 划分为相连的子集或区域 ((S_1, S_2, \ldots, S_n)),使得 (\bigcup_{i = 1}^{n} S_i = F),且对于任意 (i \neq j),有 (S_i \cap S_j = \varnothing)。为了实现这一划分,我们对图像的所有像素进行标记,每个标记对应一个色度值。算法的输出是一个二维整数标记矩阵,每个标记唯一标识图像中的一个相连区域。
该分割方法基于上述提出的混合距离。算法按顺序检查所有像素,并根据其邻域像素的标记为其分配标记。这里考虑 8 - 连通性,所有操作都针对像素的 8 - 邻域 (N_8(p))。算法的行为由四个参数配置:一方面是前面解释过的距离参数 (a)、(b)、(h);另一方面是用于测试颜色相似性的阈值 (\delta)。若 (d_H(c_1, c_2) < \delta),则认为两种颜色 (c_1) 和 (c_2) 在分割目的上是等效的。我们将 (N_8(p)) 中具有等效颜色的像素子集称为最近邻 (NN(p))。
像素标记的具体规则如下:
- 若 (NN(p)) 中的所有像素具有相同的标记,则当前像素 (p) 以及 (NN(p)) 中所有未标记的像素将采用该标记。
- 若 (NN(p)) 中的像素具有不同的标记,则说明当前像素位于一些先前标记区域的边界点,这些区域的颜色等效,因此需要将它们合并为一个唯一的标记,这就是所谓的“区域合并”。合并后,(NN(p)) 中的所有像素将根据区域合并的结果进行标记。
与其他标记算法不同的是,该算法在检查一个像素时,可以为多个像素分配标记。当前像素在当前迭代中总是被标记,同时利用当前邻域信息为后续检查过程中的像素进行标记,这种预标记策略可以加快处理速度。对于每个区域标记,我们保存其像素的平均色度和区域内的像素数量。分割算法会维护一个标记计数器 (R),并生成一个映射 (\Psi_R),将每个区域标记与其色度值和大小关联起来,即图像区域标记可表示为 (\Psi_R = [R, (\theta, \varphi), #members])。
1.3 实验结果
分割方法的自然输出是一个标记向量,这里是一个二维整数矩阵,每个数字对应一个标记。为了便于视觉观察,输出图像使用标记的色度和统一强度((l = 0.7))绘制。
为了验证所提出的分割方法,我们使用了两种不同类型的图像进行实验:一种是著名的伯克利图像数据库;另一种是机器人 NAO 拍摄的私人图像集。实验的参数设置为:(\delta = 0.02),(a = 0.2),(b = 0.4),(h = 0.5)。在这些参数下,对于暗区域(强度小于 0.2),仅使用强度距离;对于强度大于 0.4 的像素,则使用强度和色度具有相同重要性的混合距离(图像已归一化到单位区间)。
在使用伯克利数据库的实验中,由于图像之间差异较大,但使用相同的参数仍能得到较好的结果。不过,图像分割是一种人类能力,难以精确计算,对于具有不同属性的图像,可能需要不同的分割结果。因此,为了使算法输出符合我们的期望,必须设置正确的参数。
在使用机器人图像的实验中,由于图像是在相似的光照条件下拍摄的,结果比第一个实验更稳定。该方法能够有效避免高光影响,并正确检测具有不同色度属性的区域。关于处理速度,它取决于预期的粒度,即输出大小。对于机器人图像,调整输入图像大小是个不错的选择,因为机器人运动导致图像噪声较大,调整大小可以去除噪声并降低计算成本。这些实验在配备英特尔酷睿 i3 M330 处理器和 4GB 内存的笔记本电脑上进行,代码使用 C# 编写。当输出大小为 160x120 时,平均响应时间为 250ms;当输出大小为 80x60 时,平均响应时间为 50ms。
以下是实验中不同状态模型和奖励系统下训练阶段的总训练集数(单位:千次训练集):
| 状态模型 \ 奖励系统 | 0.5m 离散化步长 | 0.2m 离散化步长 |
| — | — | — |
| (S = (P_y, P_d, i)) | 6.410 | 1.740 |
| (S = (P_y, P_d, i, c)) | 5.920 | 1.410 |
| (S = (P_r, P_d, i, P_1, P_2)) | 9.830 | - |
1.4 图像分割流程
graph TD;
A[开始] --> B[初始化参数 a, b, h, δ];
B --> C[遍历图像像素 p];
C --> D[计算 p 的 8 - 邻域 N8(p)];
D --> E[找出 N8(p) 中的最近邻 NN(p)];
E --> F{NN(p) 像素标记是否相同};
F -- 是 --> G[当前像素 p 和未标记像素采用相同标记];
F -- 否 --> H[进行区域合并];
G --> I[更新标记信息];
H --> I;
I --> J{是否遍历完所有像素};
J -- 否 --> C;
J -- 是 --> K[输出分割结果];
K --> L[结束];
2. 基于 Q - 学习的软管运输控制
2.1 研究背景
在开发适用于链接多组件机器人系统(L - MCRS)的控制算法时,由于物理链接的动力学特性,这类系统具有内在的复杂性,且相关文献较少。这种复杂性增加了处理独立机器人集合的难度。作为研究的一部分,我们考虑了用单个移动机器人运输软管的问题,这是一个简单的问题表述,其结果可作为进一步推广的起点。我们选择 Q - 学习作为基本方法,通过经验学习该系统的控制器。Q - 学习是强化学习家族中的一种有吸引力的学习算法,能够从在线经验中学习,无需准确了解环境,并且已在机器人系统中得到成功应用。
2.2 实验系统设计
2.2.1 系统组成
我们研究的基本软管系统由一段软管组成,软管的一端固定(源端),另一端(末端)由一个与之相连的移动机器人运输。固定端设置在配置空间的中间,机器人的任务是将软管末端移动到目标位置。机器人的工作空间是一个 2×2 m² 的正方形区域。
2.2.2 状态定义
我们使用三种不同的状态模型来定义系统状态:
- (S = (P_r, P_d, i))
- (S = (P_r, P_d, i, c))
- (S = (P_r, P_d, i, P_1, P_2))
其中:
- (P_r = (x_r, y_r)) 是软管末端机器人的实际位置。
- (P_d = (x_d, y_d)) 是软管末端机器人的期望位置,即目标位置。
- (i) 是一个二进制变量,用于表示直线 (P_rP_d) 是否与软管相交,(i = 1) 表示相交。
- (c) 是一个二进制变量,用于表示以 (P_r) 和 (P_d) 为角点的矩形框是否与软管相交,(c = 1) 表示相交。
- (P_1 = (x_1, y_1)) 和 (P_2 = (x_2, y_2)) 是软管上从一端到另一端均匀分布的两个点。
2.2.3 工作空间离散化
我们考虑了两种不同的离散化步长:0.5 m 和 0.2 m。这种离散化决定了我们所处理的状态空间的大小,以及点 (P_r)、(P_d)、(P_1) 和 (P_2) 坐标的精度。相应地,工作空间分别被划分为 16 个和 100 个网格。
2.2.4 最终状态
最终状态分为三种类型:
- 目标达成:软管末端到达目标位置。
- 失败:软管末端被自身阻挡,无法前进。
- 不确定:模拟结束时,未达到上述两种状态。
2.2.5 动作选择
在这个问题中,我们只能通过移动机器人来改变软管末端的位置,因此动作是机器人可能的运动方向。我们选择了一个小的动作集合,仅包含四个动作:(A = { North, South, East, West }),表示机器人将沿该方向移动一个与离散化网格大小相等的距离。
2.2.6 奖励系统
我们使用了多种奖励系统,具体如下表所示:
| 奖励系统代码 | 奖励规则 |
| — | — |
| 10 | (r \leftarrow \begin{cases} +1 & \text{if 目标达成} \ -1 & \text{if 失败} \ 0 & \text{else} \end{cases}) |
| 20 | (r \leftarrow \begin{cases} +100 & \text{if 目标达成} \ -100 & \text{if 失败} \ 0 & \text{else} \end{cases}) |
| 30 | (r \leftarrow \begin{cases} +100 & \text{if 目标达成} \ -1000 & \text{if 失败} \ f(\text{distance}, i, c) & \text{else} \end{cases}),(f(\cdot) = - \left(\frac{\text{distance in cm}}{10} + 10 \cdot i + 10 \cdot c\right)) |
| 40 | (r \leftarrow \begin{cases} +100 & \text{if 目标达成} \ -100 & \text{if 失败} \ f(\text{distance}, i, c) & \text{else} \end{cases}),(f(\cdot) = \left(100 - \frac{\text{dist in cm}}{2}\right) - 10 \cdot i - 10 \cdot c) |
| 50 | (r \leftarrow \begin{cases} +1 & \text{if 目标达成} \ 0 & \text{if 失败} \ 0 & \text{else} \end{cases}) |
| 60 | (r \leftarrow \begin{cases} +100 & \text{if 目标达成} \ -100 & \text{if 失败} \ f(\text{distance}) & \text{else} \end{cases}),(f(\cdot) = 100 - \frac{\text{dist in cm}}{2}) |
| 70 | (r \leftarrow \begin{cases} +100 & \text{if 目标达成} \ -1000 & \text{if 失败} \ f(\text{dist}, i, c) & \text{else} \end{cases}),(f(\cdot) = \left(100 - \frac{\text{distance in cm}}{2}\right) - 10 \cdot i - 10 \cdot c) |
| 80 | (r \leftarrow \begin{cases} +100 & \text{if 目标达成} \ -100 & \text{if 失败} \ f(\text{distance}, i, c) & \text{else} \end{cases}),(f(\cdot) = - \left(\frac{\text{distance in cm}}{10} + 10 \cdot i + 10 \cdot c\right)) |
| 90 | (r \leftarrow \begin{cases} -1000 & \text{if 目标达成} \ +1000 & \text{if 失败} \ f(\text{distance}, i) & \text{else} \end{cases}),(f(\cdot) = \text{distance in cm} + 100 \cdot i) |
2.2.7 其他参数设置
- (\alpha):由于假设在确定性环境中工作,我们将该参数值设为 1,Q - 表的更新表达式为 (Q(s, a) \leftarrow r + \gamma \max_{a’} Q(s’, a’))。
- (\gamma):我们将其值设置为 0.9。
-
动作选择策略:采用 (\epsilon) - 贪心策略,(\epsilon) 值设置为 0.2。即选择动作 (a) 的规则为:
[
a \leftarrow
\begin{cases}
\max_{a’} Q(s, a’) & \text{with probability } (1 - \epsilon) \
\text{any } a’ \in A & \text{with probability } \epsilon
\end{cases}
]
2.3 实验结果
我们设计的实验系统地探索了状态、奖励系统和离散化步长的组合。此外,我们还获取了不同训练时间(以训练集数表示)下的实验结果数值,以便比较相同系统在不同训练参数下的学习效果。下表展示了不同状态模型和奖励系统在不同离散化步长下训练阶段的总训练集数(单位:千次训练集):
| 状态模型 \ 奖励系统 | 0.5m 离散化步长 | 0.2m 离散化步长 |
| — | — | — |
| (S = (P_y, P_d, i)) | 6.410 | 1.740 |
| (S = (P_y, P_d, i, c)) | 5.920 | 1.410 |
| (S = (P_r, P_d, i, P_1, P_2)) | 9.830 | - |
实验结果表明,奖励系统代码为 20 且状态定义为 (S = (P_r, P_d, i, P_1, P_2)) 时,取得了最佳效果,即机器人到达目标的成功率最高。
2.4 软管运输控制流程
graph TD;
A[开始] --> B[初始化参数 α, γ, ϵ];
B --> C[设置初始状态 s];
C --> D[根据 ϵ - 贪心策略选择动作 a];
D --> E[执行动作 a,得到新状态 s' 和奖励 r];
E --> F[更新 Q - 表:Q(s, a) ← r + γ maxa'Q(s', a')];
F --> G{是否达到最终状态};
G -- 否 --> H[更新状态 s = s'];
H --> D;
G -- 是 --> I[结束当前训练集];
I --> J{是否完成所有训练集};
J -- 否 --> C;
J -- 是 --> K[输出训练好的控制器];
K --> L[结束];
综上所述,图像分割和基于 Q - 学习的软管运输控制是两个具有挑战性的研究领域。图像分割方法通过引入混合距离和预标记策略,在不同类型的图像上取得了较好的分割效果;而基于 Q - 学习的软管运输控制方法通过系统的实验,找到了较为合适的参数组合,提高了机器人运输软管的成功率。未来,我们可以进一步研究如何自动估计图像分割方法中的参数,以及优化 Q - 学习算法在软管运输控制中的应用。
3. 两种研究的关联与拓展思考
3.1 关联分析
图像分割和基于 Q - 学习的软管运输控制看似是两个不同的研究方向,但实际上存在一定的关联。在机器人应用场景中,图像分割可以为机器人提供环境信息,帮助其识别不同的物体和区域。而软管运输控制则需要机器人根据环境信息做出决策,以完成软管的运输任务。例如,在使用机器人进行软管运输时,机器人可以利用图像分割技术识别软管的位置和形状,从而更好地规划运输路径。
3.2 拓展应用
- 工业自动化 :在工业生产线上,机器人可以利用图像分割技术识别零部件的位置和形状,然后使用基于 Q - 学习的控制方法将零部件运输到指定位置,提高生产效率和质量。
- 物流配送 :在物流仓库中,机器人可以通过图像分割识别货物的位置和类别,再运用软管运输控制方法将货物搬运到相应的存储区域,实现自动化的物流配送。
- 医疗领域 :在医疗机器人应用中,图像分割可以帮助机器人识别手术部位和器官的位置,而软管运输控制可以用于输送药物或医疗器械,提高手术的精准度和安全性。
3.3 未来研究方向
- 参数自动估计 :对于图像分割方法,进一步研究如何自动估计参数 (a)、(b)、(h) 和 (\delta),以减少人工干预,提高分割效果的稳定性和适应性。
- Q - 学习算法优化 :在软管运输控制中,优化 Q - 学习算法,例如改进奖励系统的设计,提高机器人的学习效率和决策能力。
- 多机器人协作 :研究多个机器人之间的协作,如何利用图像分割和 Q - 学习技术实现多机器人的协同运输任务,提高系统的整体性能。
4. 总结
4.1 研究成果总结
- 图像分割 :提出了基于混合距离的图像分割方法,该方法结合了强度和色度信息,通过区域合并和预标记策略,在不同类型的图像上取得了较好的分割效果。实验结果表明,该方法能够有效避免高光影响,正确检测具有不同色度属性的区域,并且处理速度较快。
- 软管运输控制 :采用 Q - 学习方法实现了软管运输的控制,通过系统地探索状态、奖励系统和离散化步长的组合,找到了较为合适的参数组合,提高了机器人运输软管的成功率。
4.2 研究意义与价值
这两项研究为机器人在复杂环境中的应用提供了重要的技术支持。图像分割技术可以帮助机器人更好地理解环境,而软管运输控制方法可以使机器人在处理柔性物体时更加灵活和高效。这些技术的应用将有助于推动机器人在工业、物流、医疗等领域的发展,提高生产效率和服务质量。
4.3 研究展望
未来的研究可以进一步拓展这两项技术的应用范围,优化算法性能,实现更多复杂任务的自动化处理。同时,加强多学科的交叉融合,结合计算机视觉、控制理论、机器学习等领域的知识,为机器人技术的发展带来新的突破。
以下是一个总结两种研究关键信息的表格:
| 研究方向 | 关键技术 | 主要参数 | 实验结果 | 应用前景 |
| — | — | — | — | — |
| 图像分割 | 混合距离、区域合并、预标记策略 | (a)、(b)、(h)、(\delta) | 不同图像分割效果好,处理速度快 | 工业自动化、物流配送、医疗等 |
| 软管运输控制 | Q - 学习 | (\alpha)、(\gamma)、(\epsilon)、奖励系统 | 找到合适参数组合,提高成功率 | 工业、物流、医疗等 |
graph LR;
A[图像分割] --> B[提供环境信息] --> C[机器人决策];
D[Q - 学习软管运输控制] --> C;
C --> E[工业自动化];
C --> F[物流配送];
C --> G[医疗领域];
以上内容全面总结了图像分割和基于 Q - 学习的软管运输控制的研究内容,分析了两者的关联和拓展应用,并对未来研究方向进行了展望,希望能为相关领域的研究和应用提供有益的参考。
超级会员免费看
5274

被折叠的 条评论
为什么被折叠?



