47、图像神经网络的多种应用与技术解析

time3

于 2025-07-25 16:18:02 发布

阅读量9

点赞数

CC 4.0 BY-SA版权

分类专栏：概率机器学习入门精要文章标签：图像神经网络实例分割 CNN反转

本文链接：https://blog.youkuaiyun.com/time3/article/details/151315310

概率机器学习入门精要专栏收录该内容

91 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

图像神经网络的多种应用与技术解析

1. 实例分割

在图像分割任务中，语义分割会为每个像素分配一个标签，但不会将像素分组为对象，其输出大小与输入相同。而实例分割的目标是预测图像中每个对象实例的标签和二维形状，输出数量是可变的。我们还可以将“stuff”的语义分割和“things”的实例分割结合到一个称为“全景分割”的统一框架中。

2. 通过反转卷积神经网络生成图像

用于图像分类的卷积神经网络（CNN）是一种判别模型，形式为 (p(y|x))，它以图像为输入，输出 C 个类别标签上的概率分布。我们可以将其“反转”为条件生成图像模型 (p(x|y))，从而生成属于特定类别的图像。

2.1 将训练好的分类器转换为生成模型

从该模型采样的一种方法是使用 Metropolis Hastings 算法，将 (E_c(x) = \log p(y = c|x) + \log p(x)) 作为能量函数。由于有梯度信息，可使用 (q(x’|x) = N(\mu(x), \epsilon I)) 形式的提议，其中 (\mu(x) = x + \frac{\epsilon}{2}\nabla\log E_c(x))，这称为 Metropoli