信息量和信息熵

参考:RethinkFun 【机器学习】直观理解信息量和信息熵的含义

总结

信息量越大-抽到这个结果的概率很低-不确定性越高-信息价值越高
信息量:抽到当前事件带来的信息价值,一般是概率越小,带来的价值越大,这次抽样所能排除法的不确定也就越大

信息熵:一个系统信息量的数学期望。一般一个系统的期望信息量越大,代表单次抽样抽到这个期望的概率很小,代表系统越混乱,不确定性越高。
一个系统如果在样本种类确定的情况下,抽样概率越平均,信息熵越大,因为每次抽样结果都有最大的概率与其他几次不同,所以增大了抽样结果的不确定性

介绍

信息的作用是消除不确定性。
在这里插入图片描述
一句话的信息量和它能消除的不确定性有关。
比如掷骰子,猜点数。
在这里插入图片描述
和朋友玩一个小游戏。猜小球的数字。你可以问他问题,他只能回答你yes no。为了体现信息的价值,每问一次问题都需要支付朋友1元钱。
在这里插入图片描述
由摸小球的概率理解信息熵。
可以设定每个小球被摸到的概率。并且每次摸球的结果以邮件告知。
在这里插入图片描述
第一回,摸了5次球,发了5封邮件告知摸球的结果。如上图。
在这里插入图片描述
小概率事件发生的信息量特别大。
在这里插入图片描述

这里的邮件平均信息量就是信息熵。它描述的是一个系统内发生一个事件时,这个事件能给你带来的信息量的期望。

信息熵的公式就是这个系统内所有事件发生时提供的信息量与它发生概率的乘积进行累加。
在这里插入图片描述
感性理解就是,一个系统如果是由大量小概率事件构成,那么它的信息熵就大。信息熵描述的是一个系统的复杂或者混乱程度,这一点和热力学里的熵是一致的。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值