Python计算机视觉第七章-图像搜索

目录

7.1 基于内容的图像检索

从文本挖掘中获取灵感——矢量空间模型        

7.2 视觉单词

7.3 图像索引

7.3.1 建立数据库

7.3.2 添加图像

7.4 在数据库中搜索图像

7.5 使用几何特性对结果排序


7.1 基于内容的图像检索

        在大型图像数据库上,CBIR技术用于检索在视觉上具相似性的图像。在过去的几年里,研究者成功地引入文本挖掘技术到 CBIR 中处理问题,使在数百万图像中搜索具有相似内容的图像成为可能。

从文本挖掘中获取灵感——矢量空间模型        

        矢量空间模型是一个用于表示和搜索文本文档的模型。矢量包含了每个单词出现的次数,由于其忽略了单词出现的顺序及位置,该模型也被称为 BOW 表示模型。

        最常用的权重是 tf-idf term frequency-inverse document frequency ,词频 - 逆向文
档频率 ) ,单词 w 在文档 d 中的 词频 是:
                                                        \mathrm{tf}_{w,d}=\frac{n_w}{\sum_jn_j}
        
        nw 是单词 w 在文档 d 中出现的次数。为了归一化,将 n w 除以整个文档中单词的总数。
逆向文档频率为:
                                                        \mathrm{idf}_{w,d}=\log\frac{|(D)|}{|\{d\colon w\in d\}|}
        
        |D| 是在语料库 D 中文档的数目,分母是语料库中包含单词 w 的文档数 d 。将两者
相乘可以得
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值