最大熵原理

秃头小姐

于 2021-03-11 12:44:33 发布

阅读量535

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42277332/article/details/114660614

机器学习专栏收录该内容

7 篇文章

订阅专栏

本文介绍了最大熵模型的基本概念，探讨了其与信息熵、条件熵、联合熵及互信息的关系，并分析了该模型作为分类算法的优势与局限。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最大熵原理

1.前言

最大熵模型(maximum entropy model， MaxEnt)也是很典型的分类算法了，它和逻辑回归类似，都是属于对数线性分类模型。在损失函数优化的过程中，使用了和支持向量机类似的凸优化技术。而对熵的使用，让我们想起了决策树算法中的ID3和C4.5算法。理解了最大熵模型，对逻辑回归，支持向量机以及决策树算法都会加深理解。

2.信息论

2.1信息熵

熵度量了事物的不确定性，越不确定的事物，它的熵越大。在没有外部环境的作用下，事物总是向着熵增大的方向发展，所以熵越大，可能性越大。

2.2条件熵

X确定时，Y的不确定性度量。在X发生是前提下，Y发生新带来的熵。

2.3联合熵

X，Y在一起发生时的不确定性度量

2.4互信息（信息增益）

表示两个变量X与Y是否有关系，以及关系的强弱。

可以看出，I(X,Y)可以解释为由X引入而使Y的不确定度减小的量，这个减小的量为H(Y|X)。所以，如果X,Y关系越密切，I(X,Y)就越大，X,Y完全不相关，I(X,Y)为0，所以互信息越大，代表这个特征的分类效果越好。

3.最大熵模型

最大熵模型在分类方法里算是比较优的模型，但是由于它的约束函数的数目一般来说会随着样本量的增大而增大，导致样本量很大的时候，对偶函数优化求解的迭代过程非常慢，scikit-learn甚至都没有最大熵模型对应的类库。但是理解它仍然很有意义，尤其是它和很多分类方法都有千丝万缕的联系。

惯例，我们总结下最大熵模型作为分类方法的优缺点：

最大熵模型的优点有：

最大熵统计模型获得的是所有满足约束条件的模型中信息熵极大的模型,作为经典的分类模型时准确率较高。
可以灵活地设置约束条件，通过约束条件的多少可以调节模型对未知数据的适应度和对已知数据的拟合程度

最大熵模型的缺点有：

由于约束函数数量和样本数目有关系，导致迭代过程计算量巨大，实际应用比较难。

博客等级

码龄7年

92
原创

37
点赞

81
收藏

38
粉丝

关注

私信

热门文章

分类专栏

hive 4篇
hadoop 16篇
算法-图 1篇
Sqark 1篇
机器学习 7篇
tensorflow2.0 3篇
进阶 53篇
图像处理 2篇
属性学习 3篇
业余 1篇

展开全部收起

上一篇：: 上采样和下采样

下一篇：: 2021-03-11

最新评论

Spark中的Standalone 模式配置时的坑
秃头小姐: rm -rf对应名称就可以
Spark中的Standalone 模式配置时的坑
瑾不瑜: 怎么格式化，有没有具体步骤
23 阶乘最后的非0位
长发无非遮丑: [code=cpp] //求最后非0位时，一般思路是只保留最后一位，但这是错的，因为前面的可能有进位 //天秀之笔，本来是%10，但是精度不够，因为如果每次只保留最后 //非0位的话会出错。所以在计算机允许的情况下尽可能保留多一点。 } n--; } int ans = min(num2, num5); cout << r % 10 <<" " << ans << endl; } return 0; } [/code]
23 阶乘最后的非0位
长发无非遮丑: 题目：N!的最后非零位和末尾零的个数附上完整代码[code=cpp] #include <iostream> #include<stack> #include<algorithm> #include<string> #include<stdlib.h> #include<sstream> #include<bitset> using namespace std; int getnum_2(int n) { int count = 0; while (n % 2 == 0 && n != 0) { count++; n = n / 2; } return count; } int getnum_5(int n) { int count = 0; while (n % 5 == 0 && n != 0) { count++; n = n / 5; } return count; } int main() { int n; while (cin >> n) { int r = 1; int num2 = 0; int num5 = 0; while (n) { num2 = num2 + getnum_2(n); num5 = num5 + getnum_5(n); r = n * r; if (r >= 10) { while (r % 10 == 0) { r = r / 10; } r = r % 100000; //求0的个数很简单，就是求2和5的指数中较小的那一个嘛。 //求最后非 [/code][code=cpp] [/code]
23 阶乘最后的非0位
长发无非遮丑: 姐姐你好秀啊，“n=n%1000;//100精度不够”这个是真的秀到我了，网上其他做法都没这个秀。嘻嘻，不过改成“n=n%100000;”才能得到AC，学到了！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。