week5 Bag of Visual Words (Bag of Features)

本文介绍了如何通过SIFT特征提取、K-Means聚类构建视觉词典,然后用视觉单词表示图像并进行分类。步骤包括特征提取、视觉词汇学习、量化特征和图像表示。展示了从人脸、自行车和吉他的例子中,如何通过直方图统计视觉单词频率进行图像分类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Bag of Visual Words (Bag of Features)

采用k -means 聚类方法对所提取的大量特征进行无监督聚类,将具有相似性较强的特征归入到一个聚类类别里,定义每个聚类的中心即为图像的“单词”,聚类类别的数量即为整个视觉词典的大小。这样,每个 图像就可以由一系列具有代表性的视觉单词来表示, 在得到每类图像的视觉单词袋表示之后,便可以应用这些视觉单词来构造视觉词典,然后对待分类图像进行同样方法的特征提取和描述,最后将这些特征对应到视觉词典库中进行匹配,去寻找每个特征所对应的最相似的视觉单词,得到直方图统计表示,然后应用分类器进行分类。这样就将应用于文档处理的BOW模型思想成功地移植到了图像处理领域。

Steps:

  1. Feature extraction

    特征提取

  2. Learn “visual vocabulary”

    学习“视觉词汇

  3. Quantize features using visual vocabulary

    使用视觉词汇量化特征

  4. Represent images by frequencies of “visual words”

    用“视觉单词”的频率表示图像

在这里插入图片描述

Feature extraction 局部特征提取

通过分割、密集或随机采集、关键点或稳定区域、 显著区域等方式使图像形成不同的patches,

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值