论文翻译：A Tutorial on Energy-Based Learning

最新推荐文章于 2025-06-06 09:06:50 发布

原创

最新推荐文章于 2025-06-06 09:06:50 发布 · 1.8k 阅读

1 ·

CC 4.0 BY-SA版权

本文档提供了一个关于能量学习的教程，探讨了如何将多种学习模型置于能量框架下，比较不同损失函数的优劣，并强调随机梯度法在优化中的有效性。此外，还介绍了序列建模系统如支持向量马尔可夫模型和图变换器网络的应用。

文章地址LeCun经典论文

Abstract

基于能量的模型（EBM）通过将标量能量与变量的每个配置相关联来捕获变量之间的依赖关系。推论包括钳制观测变量的值，并找出使能量最小的其余变量的配置。学习包括找到一个能量函数，其中变量的观察结构的能量比不可观测的能量要低。 EBM方法为许多学习模型提供了一个共同的理论框架，包括传统的判别式和生成式方法，图形变换网络，条件随机场，最大余量马尔可夫网络以及多种多样的学习方法。
概率模型必须正确地归一化，有时需要在所有可能的变量配置的空间上评估难以处理的积分。由于循证医学对适当的正常化没有要求，所以这个问题是自然规避的。 EBMs可以被看作是非概率因子图的一种形式，它们在架构和训练标准的设计上比概率方法提供了更多的灵活性。

1. Introduction：基于能量的模型

统计建模和机器学习的主要目的是编码变量之间的依赖关系。通过捕获这些依赖关系，可以使用模型来回答有关已知变量值的未知变量值的问题。
基于能量的模型（EBM）通过将标量能量（兼容性度量）与变量的每个配置相关联来捕获依赖关系。推断，即进行预测或决定，包括设定观测变量的值并找出使能量最小的其余变量的值。学习包括找到一个能量函数，将低能量与其余变量的正确值相关联，将高能量与不正确的值相关联。在学习

最低0.47元/天解锁文章