高速视觉伺服系统(二)

高速视觉伺服系统研究

接着上期:https://blog.youkuaiyun.com/power1_power2/article/details/80084544

算法对比

误差公式
这里写图片描述

D<W/16  :  status A+: 成功追踪
W/16 <D<3W/16 :  status A-: 可以追踪
D>W/16 :  status B: 追踪失败
Invisible  :  status C: 无法追踪(不在范围)

这里写图片描述
算法对比中采用了以下误差计算公式,其中w代表图像的宽度,H代表其高度,整个误差公式表示被追踪后图像的中心于追踪目标的中心距离,其中D的大小用右边的图表征了四种情况,接着利用样本去测试,显示结果如下,可以看到,如果使用HSV算法,只要追踪失败一次,基本很难再次锁定目标,而使用背景减法,则基本可以保证目标追踪的准确性。也就是说,证明我们算法的有效性,即带有视点转换的背景减法。
这里写图片描述

研究问题及实施方案

这里写图片描述
接下来就是研究问题及实施方案,通过这个流程图,我们很容易发现,流程的每一步都会产生一些研究问题。首先在预处理过程中,由于高速相机的帧率通常在200fps以上,曝光时间低于5ms,如果是在室内使用进光量严重不足,会导致图像的对比度和色彩都很差。在提取目标过程中,如果我们的目标形态比较复杂,那么久需要背景分割,而此时背景使动态的,也是业界的一个难题。另外检测目标的算法速度也非常重要。在摄像头追踪目标的过程中,需要采取一切手段进行加速。

高速相机原始图像质量:
进光量不足→图像对比度不足
这里写图片描述
方案:在DCT域中使用随机共振(Stochastic resonance),DCT中系数的低方差代表低能量(低对比度)。SR的机制是增加DCT系数分布的方差,导致对比度的增加。
室内进光亮不足。随机共振(SR)是一种非线性物理现象,是指一些非线性系统的输出信号可以通过在一定条件下加入适当的噪声来增强。目前常见的利用DCT域进行图像增强,由于强度分布的不连续性,图像边界有时会出现多余的边缘。

  • 动态背景下的背景分割&目标的快速检测
    动态背景的背景分割:全卷积网络(FCN) +全连接条件随机场(DenseCRF) 精确分割:
    前端使用FCN进行特征粗提取,后端使用DenseCRF优化前端的输出,最后得到分割图.
    这里写图片描述
    动态背景下的背景分割&目标的快速检测的问题,我们打算利用全卷积网络(FCN) +全连接条件随机场(DenseCRF) 精确分割进行动态背景的背景分割,分类使用的网络通常会在最后连接几层全连接层,它会将原来二维的矩阵(图片)压缩成一维的,从而丢失了空间信息,最后训练输出一个标量,这就是我们的分类标签。 而图像语义分割的输出需要是个分割图,且不论尺寸大小,但是至少是二维的。所以,需要丢弃全连接层,换上全卷积层,而这就是全卷积网络了。对于每个像素具有类别标签还有对应的观测值,这样每个像素点作为节点,像素与像素间的关系作为边,即构成了一个条件随机场。而且我们通过观测变量来推测像素对应的类别标签。
  • 更快的追踪算法:核相关滤波算法( Kernel Correlation Filter )
    这里写图片描述
    追踪算法,我们打算尝试核相关滤波算法,这是一种鉴别式追踪方法,这种方法是在追踪过程中训练一个目标检测器,使用目标检测器去检测下一帧预测位置是否是目标,然后再使用新检测结果去更新训练集进而更新目标检测器。而在训练目标检测器时一般选取目标区域为正样本,目标的周围区域为负样本,当然越靠近目标的区域为正样本的可能性越大。算法的主要目的是训练和函数,核函数训练完成之后,新来的样本直接进行映射到核空间,然后使用训练得到的函数进行运算得到函数值,对所有的位置都进行计算,就能快速的检测到目标的位置所在。文章中为了介绍方便,作者使用了单通道一维的数据表示去进行讲解,可以直接扩展到二维的情况。一维的情况下就是矩阵想乘的问题了,就是矩阵分析当中学过的左乘一个单位矩阵和右乘一个单位矩阵。左乘是行变换,右乘列变化。目的就是得到更多的样本,每乘一次都是一个新的样本,这样的话就可以多出来n*n个样本了,这就是循环矩阵在这里最大的用处,制造样本的数量,以图像的形式展示就是这样的,一个样本经过循环矩阵之后就可以产生这么多的样本。
  • 系统搭建
    这里写图片描述
    这里写图片描述
    整体系统示意图+系统搭建实拍图+相机与振镜近拍图:基本流程包括:
    1.摄像机连续捕获乒乓球高速飞行的视频帧。
    2.处理器及时处理由摄像机捕获到的图片,通过检测算法检测出球在图片中的区域,得到二维位置。
    3.将位置信息交付给数据采集卡,使其在乒乓球偏离图像中心区域的时候输出模拟信号。
    4.模拟信号驱动电机,让两片扫描振镜根据要求旋转,调整相机视线位置。

总结与展望

高速视觉伺服系统在体育比赛、车辆碰撞检测、昆虫观察等领域都有重要作用。更好的硬件结构和更快的追踪算法以实现“自动对焦”,使摄像机保持正确的视角方向。这将是以后研究的重点方向。

文献调研:
[1] Okumura K, Oku H, Ishikawa M. High-speed gaze controller for millisecond-order pan/tilt camera[C]// IEEE International Conference on Robotics and Automation. IEEE Xplore, 2011:6186-6191.
[2] Henriques J F, Rui C, Martins P, et al. High-Speed Tracking with Kernelized Correlation Filters[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2015, 37(3):583.
[3] Okumura K, Oku H, Ishikawa M. Acitve projection ar using high-speed optical axis control and appearance estimation algorithm[C]// IEEE International Conference on Multimedia and Expo. IEEE, 2013:1-6.
[4] Hare S, Saffari A, Torr P H S. Struck: Structured output tracking with kernels[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2016, 38(10):2096.
[5] Okumura K, Oku H, Ishikawa M. Optical gaze control system to realize more high-speed active vision. J. Robot. Soc. Jpn. 2011;29:201–211. Japanese.

如果觉得本文写的还不错的伙伴,可以给个关注一起交流进步,如果有在找工作且对阿里感兴趣的伙伴,也可以发简历给我进行内推:
在这里插入图片描述

高速飞拍视觉系统的实现需要综合考虑硬件选择、运动控制策略、图像采集与处理算法等多个方面。以下是一些关键的技术方案和实现方法: ### 1. 高速工业相机的选择 高速飞拍系统的核心是高速工业相机,它能够在极短的时间内捕捉高质量的图像。选择合适的相机时,需关注以下几个参数: - **分辨率**:根据检测对象的尺寸和精度要求选择适当的分辨率。 - **帧率**:为了适应高速运动场景,相机必须具备高帧率(如每秒数千帧)[^1]。 - **接口类型**:常见的高速接口包括GigE Vision、USB3 Vision等,确保数据传输的实时性和稳定性。 ### 2. 精密运动控制系统的设计 在飞拍过程中,设备处于持续运动状态,因此对运动控制的要求非常高。系统通常采用高性能伺服电机或直线电机来实现高精度的位置控制和速度调节。 - **同步触发机制**:通过编码器反馈信号,使相机在特定位置进行精准拍摄。例如,在生产线上的某个固定点触发拍照,确保每次拍摄的对象处于相同位置[^2]。 - **轨迹规划**:优化运动轨迹以减少振动和误差,提高成像质量。 ### 3. 光源与照明设计 良好的照明条件对于获取清晰图像至关重要。在高速飞拍中,光源需要具备以下特点: - **高亮度**:确保在短时间内提供足够的光照强度。 - **均匀性**:避免阴影和反光影响图像质量。 - **频闪功能**:配合相机快门进行瞬间闪光,减少动态模糊。 ### 4. 图像处理与分析算法 获取到图像后,下一步是对图像进行处理和分析。常用的图像处理技术包括边缘检测、特征提取、模板匹配等。 - **实时处理能力**:采用高性能GPU或FPGA加速图像处理流程,满足高速应用的需求。 - **深度学习模型**:利用卷积神经网络(CNN)进行缺陷识别、分类等任务,提高检测准确率[^3]。 ### 5. 软件平台与系统集成 开发一个完整的高速飞拍视觉系统还需要一个强大的软件平台来进行数据管理、图像处理以及与其他设备通信。 - **开发工具**:可以使用OpenCV、Halcon等开源或商业库进行图像处理。 - **人机交互界面**:提供直观的操作界面,方便用户设置参数、查看结果并进行故障诊断。 ### 示例代码:基于Python的简单图像处理流程 ```python import cv2 import numpy as np # 加载图像 image = cv2.imread('high_speed_image.jpg') # 转换为灰度图 gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 应用Canny边缘检测 edges = cv2.Canny(gray_image, threshold1=50, threshold2=150) # 显示原始图像和边缘检测结果 cv2.imshow('Original Image', image) cv2.imshow('Edges', edges) cv2.waitKey(0) cv2.destroyAllWindows() ``` ### 技术挑战与解决方案 尽管高速飞拍视觉系统具有诸多优势,但在实际应用中仍面临一些挑战: - **数据量大**:高速相机产生的大量数据可能导致存储和处理瓶颈。可以通过压缩技术和分布式计算来解决这一问题。 - **实时性要求高**:为保证系统的响应速度,可采用嵌入式系统或专用硬件(如FPGA)进行加速。 - **环境干扰**:外部光线变化、粉尘等因素可能影响成像质量。为此,应选用抗干扰能力强的传感器,并优化现场环境。 总之,构建一个高效的高速飞拍视觉系统需要从多个层面入手,结合先进的硬件设备、精确的运动控制策略以及智能的图像处理算法,才能充分发挥其在工业自动化中的潜力。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值