53、视觉词模型：原理、应用与发展

云朵来信

于 2025-11-13 16:53:50 发布

阅读量12

点赞数

CC 4.0 BY-SA版权

分类专栏：解码视觉的数学之美文章标签：视觉词模型词袋模型星座模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/b0c1d2/article/details/154906532

解码视觉的数学之美专栏收录该内容

56 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

视觉词模型：原理、应用与发展

1. 星座模型中的视觉词共享

在星座模型里，视觉词的共享呈现出特定规律。例如，从训练集中选取的十六张图像（每个类别两张），通过黄色椭圆标记出与图像某一部分相关的视觉词。这些视觉词大多与动物图像面部的下部相关。同时，还存在对应动物侧面腿部以及物体轮子的部分，各部分都有其对应的视觉词集合。

2. 推理过程

在推理阶段，需要计算新图像数据在每个可能对象下的似然。对于新图像数据 ${f_j,x_j} {j = 1}^{J}$，在每个可能对象 $w \in {1…N}$ 下的似然计算公式为：
[
Pr(f,X|w = n) = \prod {j = 1}^{J} \sum_{m = 1}^{M} Pr(p_j = m|w = n)Pr(f_j|p_j = m)Pr(x_j|p_j = m) = \prod_{j = 1}^{J} \sum_{p_j = 1}^{M} Cat_{p_j}[\pi_n]Cat_{f_j}[\lambda_{p_j}]Norm_{x_{ij}}[\mu_{p_j},\Sigma_{p_j}]
]
接着，定义合适的先验概率 $Pr(w)$，并利用贝叶斯规则计算后验分布：
[
Pr(w = n|f,X) = \frac{Pr(f,X|w = n)Pr(w = n)}{\sum_{n = 1}^{N} Pr(f,X|w = n)Pr(w = n)}
]

3. 场景模型

星座模型存在一定局限性，它假设图像中仅包含单个对象，但实际图像通常包含多个空间偏移的对象。场景模型应运而生，场景决定了观察不同对象的相

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。