halcon的形状匹配算法执行速度极快,以下面这张图为例,分辨率
:2448×2048(500万像素),角度范围
:360°,亚像素
:least_squares,halcon仅用了10ms左右,如果在程序中调用,最短仅需5 - 6ms,halcon是如何做到的呢?其底层运用了哪些技术与方法呢?
抱着上面的疑问,我下载了intel vtune profiler,这是一个高性能分析工具,可以做热点分析、微架构分析、并行性分析、内存与I/O分析。然后将halcon的匹配过程封装为一个C++函数,在一个线程中循环运行5000次,下图是得到的性能快照以及数据解析。
分析结果显示,