脑图像深度学习及其在多发性硬化症中的应用
1. 深度学习简介
深度学习是机器学习的一个领域,自20世纪80年代初就开始被研究。直到2000年代后期,随着快速通用图形处理器、逐层预训练方法和大型数据集的出现,深度学习方法才开始流行起来。此后,深度学习方法在许多非医学和医学应用中成为了最先进的技术。
深度学习方法通常具有两个共同特性:一是使用多层非线性处理单元来提取特征;二是这些层被组织成一个从低级到高级特征的层次结构。以面部图像为例,特征层次结构的最低层由原始像素强度组成,多个像素可以组合形成边缘和角落等一般图像特征,这些特征又可以进一步组合形成面部的各个部分,最终多个面部部分可以组合形成各种面部图像。学习特征层次结构有助于用少量值对大特征空间进行参数化。
1.1 从无标签输入图像中学习
深度学习的一个重要应用是从无标签图像中学习特征层次结构。关键在于深度模型能够逐层训练,每层作为一个非线性特征提取器。
1.1.1 从受限玻尔兹曼机到深度信念网络
受限玻尔兹曼机(RBM)是一种由二分图定义的概率图形模型,其单元分为可见单元层 (v) 和隐藏单元层 (h)。RBM 定义了可见单元和隐藏单元的联合概率:
[p(v, h | θ) = \frac{1}{Z(θ)}e^{-E(v,h|θ)}]
当可见和隐藏单元为二进制时,能量定义为:
[-E(v, h | θ) = \sum_{i,j} v_iw_{ij}h_j + \sum_{i} b_iv_i + \sum_{j} c_jh_j = v^TWh + b^Tv + c^Th]
其中 (Z(θ)) 是归一化常数,(W) 是连接可见单