相似检索:
颜色特征提取:
目标:统计图片的颜色成分--->颜色聚类直方图
方法:使用K-means++对图片进行聚类
通过CIEDE2000算出颜色之间的差异
相似纹理检索:
目标:实现基于人类纹理感知的相似排序
纹理特征提取:多方向,多尺度Gabor滤波器组
特征计算:Kmeans++聚类直方图
相似形状检索:
PHOG形状特征提取(效果一般)
局部特征点:
检测出所有局部特征点,特征描述子
SIFT特征点,通过两个图SIFT电集之间的匹配对数(双向匹配)来找到相似图片
词包(Bag of Visual Word):
忽略文本的语法和语序,用一组无序的单词来表达一段文字和一个文档
需要构建视觉词汇的字典,通过收集图片集的所有视觉词汇,利用Kmeans算法对所有词汇聚类,收缩为字典
索引加速
KD-tree:
一种用于多维度检索的二叉平衡树(用于不是特别高维度的情况)
先找到中点节点(根节点),先对X项进行排序,然后再对Y项进行排序
回溯:检查查询路径上节点的另一半子空间是否有距离更近的点
局部敏感哈希(Locality Sensitive Hash):
使得两个相似度很高的数据以较高的概率映射成同一个hash值,而令2个相似度很低的数据以极低的概率银蛇成同一个hash值。
能够高效处理海量高维数据的最近邻问题