MRF; BM; RBM

最新推荐文章于 2021-01-04 14:49:39 发布

原创最新推荐文章于 2021-01-04 14:49:39 发布 · 778 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#MRF #BM #RBM

机器学习专栏收录该内容

7 篇文章

订阅专栏

Markov Random Field
详细资料见Bishop的Pattern recognition and Machine Learning
Graphic Model分为有向图模型和无向图模型，无向图模型也叫做Markov networks 或 Markov random field.
我们以简单的Markov network，pairwise Markov networks来说明 Markov random field
一个简单的例子：
假设有四个学生，两个人一组做作业。A和C关系不好，所以不能在一起。B和D的作息时间不一致，也不能在一起,。最终下面4个对，(A,B)；(B,C)；(C,D)；(D,A)。我们假设作业本身有一些问题，从而使得学生对资料由正确或者错误的理解。两个学生在做作业的过程中会对彼此产生影响。比如，A和B在一起做作业，如果A的理解有误，那么B可能也会理解错误，注意这种影响是双向的。因此，我们可以一个无向图代表这个模型。

如何用数学语言描述这个图呢？
我们引入factors，如下所示

这些factors 通常叫做infinity functions，compatibility functions or soft constraints. 那么这些factors代表什么意思呢？以

ϕ1 $\phi_{1}$ 说明，这些值表示了A和B在一起做作业的local happiness。我们看到最高的值是30，表示两个人都对作业理解正确时，it is the happy assignment.当两个人对作业都理解错误时，happiness有所降低。
从其他的因子，可以得到以下信息：B ans C really like to agree with each other；C and D like to argue with each other all the time；A and D like to agree.
we are going to use the notion of product of factors an so here we are and we are going to take all these factors and we are going to multiply them together.

P ˜ (A, B, C, D) = ϕ 1 (A, B) * ϕ 2 (B, C) * ϕ 3 (C, D) * ϕ 4 (D, A)

$\widetilde{P}(A,B,C,D)= \phi_{1}(A,B)* \phi_{2}(B,C)* \phi_{3}(C,D)* \phi_{4}(D,A)$ 值如下所示：

这不是一个概率密度函数，因为它的值不是在0~1，因此需要normalized

P ˜ (A, B, C, D) = 1 / Z * P (A, B, C, D)

$\widetilde{P}(A,B,C,D)= 1/Z * P(A,B,C,D)$ Z称作the partition function, 即是图中所有值的和。
现在我们观察它的边缘概率分布函数P(A,B)

从图中，我们可以看出A0B1概率较高，怎么理解这个现象呢？
A agree with D相似，B agree with, D disagree with C。这三个都是很强的连接关系（值都是100），要使得整个网络做出平衡，那么只有牺牲较弱连接的AB，使得A disagree B，在

ϕ1 $\phi_1$ 中A0B1具有较大的值，因此最终得到较大的边缘概率。
上面只是一个简单的pair-wise形式的，可以将其拓展为一般的形式。用

XC $X_C$ 来表示圈C中的变量，联合分布函数就可以写为potential function

ϕC(xC) $\phi_C(x_C)$ 的乘积，如下：

p (x) = 1 Z \prod ϕ C (X C); Z = \sum \prod ϕ C (X C)

$p(x)=\frac{1}{Z}\prod \phi _C(X_C); Z = \sum \prod \phi _C(X_C)$ 如果我们限制potential function的值都为正，这样potential function就可以写为

ϕC(XC)=exp(−E(XC)) $\phi_C(X_C) = exp(-E(X_C))$ ,

E(XC) $E(X_C)$ 称为energy function.从而我们可以得到最终的联合分布函数：

p (x) = 1 Z e x p (\sum - E (X C))

$p(x)=\frac{1}{Z}exp(\sum -E(X_C))$
Boltzmann Machine
RBM在deep learning中有广泛的应用。
BM的图结构如下

图中的节点可以分为hidden和visible节点，energy function表示如下：

E (v, h | θ) = - b' v - c' h - h' W v - v' U v - h' V h

$E(v,h|\theta) = -{b}'v - {c}'h - {h}'Wv - {v}'Uv - {h}'Vh$ b与每个visible node相关;c与每个hidden node相关;W衡量visible node和hidden node相关性,U,V分别衡量visible nodes及hiden nodes之间的相关性。
Restricted Boltzmann Machine
取消了v和h变量的内部联系，就得到RBM的模型，如下图所示： RBM