文章地址LeCun经典论文
Abstract
基于能量的模型(EBM)通过将标量能量与变量的每个配置相关联来捕获变量之间的依赖关系。推论包括钳制观测变量的值,并找出使能量最小的其余变量的配置。学习包括找到一个能量函数,其中变量的观察结构的能量比不可观测的能量要低。 EBM方法为许多学习模型提供了一个共同的理论框架,包括传统的判别式和生成式方法,图形变换网络,条件随机场,最大余量马尔可夫网络以及多种多样的学习方法。概率模型必须正确地归一化,有时需要在所有可能的变量配置的空间上评估难以处理的积分。由于循证医学对适当的正常化没有要求,所以这个问题是自然规避的。 EBMs可以被看作是非概率因子图的一种形式,它们在架构和训练标准的设计上比概率方法提供了更多的灵活性。
1. Introduction:基于能量的模型
统计建模和机器学习的主要目的是编码变量之间的依赖关系。通过捕获这些依赖关系,可以使用模型来回答有关已知变量值的未知变量值的问题。基于能量的模型(EBM)通过将标量能量(兼容性度量)与变量的每个配置相关联来捕获依赖关系。推断,即进行预测或决定,包括设定观测变量的值并找出使能量最小的其余变量的值。学习包括找到一个能量函数,将低能量与其余变量的正确值相关联,将高能量与不正确的值相关联。在学习