【原理】如何形象地理解交叉熵-信息熵

本文来自《老饼讲解-BP神经网络》https://www.bbbdata.com/

交叉熵、信息熵概念基本贯穿了机器学习、深度学习中的类别识别模型,例如KL分布、softmax等等都是基于交叉熵与信息熵的理论进行定义的,本文不妨形象梳理一下什么是交叉熵、信息熵,以此一通百通。

一、信息量

1.1.什么是信息量

信息量是对信息的一种量化指标,用于衡量信息的大小,最常用的是香农信息量,香农信息量的定义与计算公式如下:
h ( x ) = − ln ⁡ ( p ( x ) ) h(x)=−\ln(p(x)) h(x)=ln(p(x))

其中,p是事件x发生的概率,h则为事件x所包含的香农信息量。
从式中可以看到,事件的香农信息量与事件的概率成反比,
香农信息熵
即一件事发生的概率越小,则包含的信息量越大

二、什么是信息熵

2.1.什么是信息熵

信息熵通俗来说就是信息量的期望,香农信息熵则是香农信息量的期望
如果已知 x 有 n 种取值,且知道每种取值的概率,则 x 的香农信息熵如下:
H ( x ) = − ∑ i n p ( x i ) ln ⁡ p ( x i ) \displaystyle H(x) = -\sum\limits_{i}^{n}p(x_i)\ln p(x_i) H(x)=inp(xi)lnp(xi)

2.2. 信息熵的意义

为什么要单独把"信息量的期望"单独拎出来命名为"信息熵"呢?因为信息熵是一个常用的概念,例如用信息熵来评估事件的混沌程度,当我们对一个事件越不确定时,即越混沌时,在得知该事件的确切值时期望获得的信息量就越多,即事件越混沌,事件的信息熵就越大:
信息熵用于评估事件的混沌性
因此,一般可用信息熵来评估一个事件的混沌程度,或者我们对事件的掌握程度

三、交叉熵

3.1.什么是交叉熵

如果已知 X 有 n 种取值,我们认为第 i 种取值的概率为 q ( x i ) q(x_i) q(xi),事实上第i种取值的概率为 p ( x i ) p(x_i) p(xi),则定义在知道X的真实取值时所获得的信息量期望为交叉熵
什么是交叉熵
香农交叉信息熵的公式如下:
C ( p , q ) = − ∑ i n p ( x i ) ln ⁡ q ( x i ) \small \displaystyle C(p,q) = -\sum\limits_{i}^{n}p(x_i)\ln q(x_i) C(p,q)=inp(xi)lnq(xi)

3.2.如何理解交叉熵的意义

交叉熵经常用于评估概率模型的预测效果的准确程度,交叉熵越小,说明模型越准确
交叉熵的意义
为什么交叉熵越小,模型就越准确呢?
因为交叉熵就是知道X的真实取值时所获得的信息量期望,交叉熵越小,说明信息量越小。
模型的交叉熵越小(知道真实标签时的信息量小),那说明基于模型我们已经基本掌握了样本的标签类别信息了。

相关链接:

《老饼讲解-机器学习》:老饼讲解-机器学习教程-通俗易懂
《老饼讲解-神经网络》:老饼讲解-matlab神经网络-通俗易懂
《老饼讲解-神经网络》:老饼讲解-深度学习-通俗易懂

### 多尺度交叉样本熵的时间序列相关性分析 #### 定义与原理 多尺度交叉样本熵(Multiscale Cross-Sample Entropy, MSCE)是一种用于评估两个时间序列在多个时间尺度上复杂性和同步性的工具。该方法不仅能够捕捉短时间内的动态变化,还能揭示长时间范围内的模式一致性。 MSCE计算过程涉及以下几个方面: - **粗粒化处理**:原始信号被分解成不同的时间尺度表示形式。具体来说,在每个尺度因子τ处,新构建的数据点由相邻τ个观测值的平均值得到[^1]。 - **距离定义**:设定阈值r以衡量两组数据间的相似程度;当一对向量间最大差值不超过此界限时视为匹配成功。 - **概率估计**:统计满足上述条件模板对的比例p(m),并进一步求解其自然对数得到单尺度下的交叉样本熵SampEn[m](X,Y)。 - **多尺度转换**:重复以上步骤直至达到预定的最大尺度层数N,最终形成一系列反映各层次结构特性的指标集合{SampEn[i]}(i=1,...,N)。 ```python import numpy as np from entropy import multiscale_cross_sample_entropy def calculate_msce(x, y, scale_max=20, m=2, r=0.2): """ 计算给定时间序列x,y之间的多尺度交叉样本熵 参数: x (array-like): 第一个时间序列 y (array-like): 第二个时间序列 scale_max (int): 最大尺度数量,默认为20 m (int): 嵌入维度,默认为2 r (float): 距离阈值比例,默认为0.2 返回: array: 各尺度层对应的交叉样本熵值列表 """ msce_values = [] for i in range(1, scale_max + 1): value = multiscale_cross_sample_entropy( x=x, y=y, scale=i, metric='chebyshev', sample_length=len(x), tolerance=r * np.std(np.concatenate((x, y))), dimension=m ) msce_values.append(value) return np.array(msce_values) ``` #### 应用场景 这种方法广泛应用于生理信号处理领域,比如心电图(ECG)、脑电图(EEG)以及肌电信号(EMG)等生物医学工程方向。除此之外,在金融市场波动特性探究中也展现出独特优势,有助于理解资产价格走势背后隐藏的信息传递机制[^2]。 对于小样本金融时间序列数据分析而言,结合适当的数据增强手段如插值法可有效提升模型鲁棒性及预测精度。这同样适用于基于深度学习框架开展的研究工作,其中涉及到卷积神经网络(CNNs)或多头自注意力机制(Transformers)的设计优化问题[^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

老饼讲解-BP神经网络

请老饼喝杯咖啡

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值