正在做一个基于内容的图像检索项目,客户要求可以让用户提取图片上的任意形状的子图作为输入。为了实现这个功能,花了不少精力,中间绕了不少圈子。现在问题总算解决了,把主要的思路记录一下,希望能帮到有同样需求的朋友。
效果如下:
由于这个项目使用了第三方的开源图像库opencv,所以这个功能也是借助opencv来实现的。
首先需要解决的是在图片中绘制曲线的问题,思路很简单,只需要响应鼠标事件通过描点、连线的方式就可以完成。在opencv中需要使用回调来响应鼠标事件,opencv中文站上有很好的示例,关键代码:
01 |
#include
"cv.h" |
02 |
#include
"highgui.h" |
03 |
#include |
04 |
|
05 |
|
06 |
|
07 |
|
08 |
|
09 |
<stdio.h> |
10 |
|
11 |
|
12 |
|
13 |
|
14 |
|
15 |
|
16 |
#include |
17 |
|
18 |
|
19 |
|
20 |
|
21 |
|
22 |
<stdlib.h> |
23 |
|
24 |
|
25 |
|
26 |
|
27 |
|
28 |
|
29 |
30 |
IplImage*
inpaint_mask = 0; |
31 |
IplImage*
img0 = 0, *img = 0, *inpainted = 0; |
32 |
CvPoint
prev_pt = {-1,-1}; |
33 |
34 |
void on_mouse( int event, int x, int y, int flags, void*
zhang) |
35 |
{ |
36 |
if(
!img ) |
37 |
return; |
38 |
if(
event == CV_EVENT_LBUTTONUP || !(flags & CV_EVENT_FLAG_LBUTTON) ) |
39 |
prev_pt
= cvPoint(-1,-1); |
40 |
else if(
event == CV_EVENT_LBUTTONDOWN ) |
41 |
prev_pt
= cvPoint(x,y); |
42 |
else if(
event == CV_EVENT_MOUSEMOVE && (flags & CV_EVENT_FLAG_LBUTTON) ) |
43 |
{ |
44 |
CvPoint
pt = cvPoint(x,y); |
45 |
if(
prev_pt.x < 0 ) |
46 |
prev_pt
= pt; |
47 |
cvLine(
inpaint_mask, prev_pt, pt, cvScalarAll(255), 5, 8, 0 ); |
48 |
cvLine(
img, prev_pt, pt, cvScalarAll(255), 5, 8, 0 ); |
49 |
prev_pt
= pt; |
50 |
cvShowImage( "image",
img ); |
51 |
} |
52 |
} |
53 |
54 |
int main( int argc, char**
argv ) |
55 |
{ |
56 |
char*
filename = argc >= 2 ? argv[1] : (char*)"fruits.jpg"; |
57 |
if(
(img0 = cvLoadImage(filename,-1)) == 0 ) |
58 |
return 0; |
59 |
printf( "Hot
keys: \n" |
60 |
cvNamedWindow( "image",
1 ); |
61 |
img
= cvCloneImage( img0 ); |
62 |
inpainted
= cvCloneImage( img0 ); |
63 |
inpaint_mask
= cvCreateImage( cvGetSize(img), 8, 1 ); |
64 |
cvZero(
inpaint_mask ); |
65 |
cvZero(
inpainted ); |
66 |
cvShowImage( "image",
img ); |
67 |
cvShowImage( "watershed
transform",
inpainted ); |
68 |
cvSetMouseCallback( "image",
on_mouse, 0 ); |
69 |
} |
70 |
|
71 |
|
72 |
|
73 |
|
74 |
|
75 |
</stdlib.h> |
76 |
|
77 |
|
78 |
|
79 |
|
80 |
|
81 |
</stdio.h> |

第二步,利用封闭曲线提取图形,时间和精力都主要浪费在这一块了,最开始的想法是通过扫描线的方法获取,但最终做出来的效果差强人意,连自己这关都过不了。最后几经转折,找到了这样一个函数cvFloodFill(),这个函数可根据边界填充图像连通域,正是我所需要的。关键代码:
01 |
if(event
== CV_EVENT_RBUTTONUP) |
02 |
{ |
03 |
cvFloodFill(maskImg,cvPoint(x,y),cvScalarAll(255)); |
04 |
cvSaveImage("maskImg.bmp",maskImg); |
05 |
IplImage
*segImage=cvCreateImage(cvGetSize(img),8,3);; |
06 |
cvCopy(img,segImage,maskImg); |
07 |
cvSaveImage("segImage.bmp",segImage); |
08 |
cvCopy(segImage,proc->img); |
09 |
cvReleaseImage(&segImage); |
10 |
cvDestroyWindow("Key
Image"); |
11 |
} |
效果如下:

本文介绍了一种基于OpenCV的图像子图提取方法,通过鼠标交互绘制任意形状,并利用cvFloodFill()函数进行区域填充及分割,适用于内容基于图像检索的应用场景。
9960

被折叠的 条评论
为什么被折叠?



