Image Contour and Junction Detection

本文探讨了视觉感知组织的概念及其在目标识别中的应用,包括线结构传达的主要信息、边缘检测方法的发展历史以及如何利用曲线连续性进行边缘连接检测。自80年代起,研究者开始将感知组织作为目标识别的前期工作,采用Berkeley Vision Group的方法,通过亮度、颜色和纹理学习局部边界特征,从全局角度捕捉闭合和连续性,并检测和定位接点。该文还介绍了Berkeley Segmentation Dataset(BSDS)和用于评价边缘检测算法的精度-召回曲线、F-measure等指标。

Perceptual Organization: 

“…the processes by which the bits and pieces of visual information that are available in the retinal image are structured into the larger units of perceived objects and their interrelations”(Stephen E. Palmer,  Vision Science , 1999)
“将视觉可见的比特值和可视信息碎片组成更大单位的感知对象并建立它们之间的关联。”


Attneave's Cat (1954): 线的结构传达主要信息

Contour 's  History

局部边缘检测方法-1970s和80s早期;
Sobel, Rosenfeld, Binford-Horn, Marr-Hildreth, Canny …

利用曲线的连续性进行边缘连接检测
Rosenfeld, Zucker, Horn, Ullman …

80s开始有一些人将Perceptual Organization作为目标识别的前期工作。
Binford, Witkin and Tennebaum, Lowe,  Jacobs …


Berkely Vision Group

收集人为分割的数据集
结合亮度、颜色和纹理学习局部边界特征
从全局的角度来捕捉closure和continuity
检测和定位junctions
将底层(pixel)、中层(edge)和高层(region)的信息集成来分组和分割。

Berkeley Segmentation Data Set[BSDS]

D. Martin, C. Fowlkes, D. Tal, J. Malik. "A Database of Human Segmented Natural Images and its Application to Evaluating Segmentation Algorithms and Measuring Ecological Statistics", ICCV, 2001

Note:
1. precision-recall 曲线: 与ROC曲线相似,但不完全相同
          precision->计算出的边缘像素是真实边缘的概率;(TP/(TP+FP))
          recall->真实边缘概率被检测出来的概率. (TP/(TP+FN))
2. F-meature: precision与recall的调和平均数(2/(1/P+1/R))
          F值越大效果越好
3. 为什么不使用ROC曲线评价:
          ROC曲线中的FPT=FP/(FP+TN),图像分辨率一旦变化,TN随之二次方变化, TP则线性变化,FP线性变化,那么FPT则1/n比例变化,而Recall依旧是线性变化,所以ROC曲线在图像领域不是很适合。

Martin, Fowlkes, Malik PAMI 04’


Using Contours to Detect and Localize Junctions in Natural Images. CVPR. 2008

     1. Contour Detection:

  • 计算亮度、颜色和纹理三个通道(1976 CIE Lab color space)在一定半径的圆内,方向角为的梯度值;

  • Normalized Cuts criterion(Jianbo Shi.PAMI’.2000)
  1. (D - W) x = lDx 
  2. W定义为连接两个像素的边上mPb最大值
  3. D为像素到其他所有像素的W值总和
  4. 解特征值和特征向量

  5. 权值通过梯度上升法学习

     2. Localized Junctions

  • 求在窗口内距离各轮廓边缘最近的点
     
  • 更新各轮廓权重
     
  • 重复5次(已收敛),将没有经过junction的轮廓作为干扰去掉

总结

1.自底向上的提取方法
2.计算复杂度比较大->Efficient, High-Quality Image Contour Detection. (ICCV, 2009)
### 使用RefineContourNet进行物体轮廓和边缘检测 在计算机视觉领域,RefineContourNet是一种用于改进物体轮廓和边缘检测的技术。该方法旨在提高边缘检测的质量并增强对复杂自然场景中物体边界识别的能力。 #### RefineContourNet的工作原理 RefineContourNet通过多阶段细化过程来提升边缘检测的效果。具体来说: - **初始边缘提取**:利用传统的边缘检测算法(如Sobel算子或Canny算子),初步获取图像中的潜在边缘位置[^1]。 - **特征学习与优化**:引入卷积神经网络(CNN),特别是针对边缘特性的设计架构,在预处理后的数据集上训练模型以捕捉更精细的几何特性。这一过程中会特别关注于区分真实的边缘和其他噪声干扰项[^2]。 - **后处理及精炼**:经过CNN预测得到的结果还需进一步过滤和平滑化操作,去除伪阳性和不连贯的部分;最终输出更加平滑且闭合良好的轮廓线作为目标物的边界表示[^3]。 ```python import torch from torchvision import models, transforms from PIL import Image # 加载预训练的RefineContourNet模型 model = models.segmentation.deeplabv3_resnet101(pretrained=True) def refine_contour(image_path): preprocess = transforms.Compose([ transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]), ]) input_image = Image.open(image_path).convert('RGB') input_tensor = preprocess(input_image) input_batch = input_tensor.unsqueeze(0) model.eval() with torch.no_grad(): output = model(input_batch)['out'][0] prediction = output.argmax(0).byte().cpu().numpy() return prediction ``` 上述代码展示了如何加载一个基于ResNet101骨干网的DeepLabV3+实例,并定义了一个简单的函数`refine_contour()`来进行单张图片上的边缘检测任务。实际应用中可能还需要根据具体的RefineContourNet实现调整输入尺寸、归一化参数等细节配置[^4]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值