机器学习——最大熵原理

这篇博客介绍了信息论中的熵概念,由克劳德·艾尔伍德·香农引入。熵是衡量信息不确定性的平均量,与概率P成单调递减关系。在机器学习中,条件最大熵模型被用来建立区分性的条件概率模型,它在已知信息的约束下寻找熵最大的模型,避免做出过多未知假设。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  首先介绍什么是熵。
  在信息论中,是接收的每条消息中包含的信息的平均量。熵是在1948年由克劳德·艾尔伍德·香农将热力学的熵引入到信息论的,因此它又被称为香农熵。
不确定性函数f满足两个条件是:
(1)概率P的单调递降函数;
(2)两个独立符号所产生的不确定性应等于各自不确定性之和(可加性),即
       f(P1,P2)=f(P1)+f(P2)。
同时满足这两个条件的函数f是对数函数,即
               这里写图片描述
  在信源中,考虑的不是某一单个符号发生的不确定性,而是要考虑这个信源所有可能发生情况的平均不确定性。若信源符号有n种取值:U1…Ui…Un,对应概率为:P1…Pi…Pn,且各种符号的出现彼此独立。这时,信源的平均不确定性应当为单个符号不确定性-logPi的统计平均值(E),可称为信息熵,即,
        这里写图片描述
  式中对数一般取2为底,单位为比特。但是,也可以取其它对数底,采用其它相应的单位,它们间可用换底公式换算。
  假设我们的分类任务或者预测任务的类别为y,而我们能够依据的上下文信息记为

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值