熵(Entropy)

1. 什么是熵?

熵(Entropy)最早起源于物理学中的热力学,后来由克劳德·香农(Claude Shannon)引入信息论,成为描述系统不确定性或随机性的量度。直观来说,熵衡量的是一个系统的“混乱程度”或“信息含量”。在不同领域,熵有不同的具体含义:

  • 热力学:熵表示系统的无序程度,例如一个孤立系统中分子分布的混乱程度。
  • 信息论:熵衡量随机变量的不确定性或传递信息所需的平均信息量。
  • 机器学习:熵用于量化数据集的纯度(如决策树中的信息增益)或模型的不确定性(如生成模型中的概率分布)。

在人工智能领域,我们主要关注信息论中的熵,因为它直接与数据、模型和算法相关。


2. 信息论中的熵

信息论中的熵由香农于1948年提出,用于衡量一个随机变量的不确定性。假设有一个离散随机变量 XXX,其可能取值为 { x1,x2,…,xn}\{x_1, x_2, \dots, x_n\}{ x1,x2,,xn},每个取值的概率为 P(X=xi)=piP(X = x_i) = p_iP(X=xi)=pi。熵 H(X)H(X)H(X) 定义为:

H(X)=−∑i=1npilog⁡2piH(X) = - \sum_{i=1}^n p_i \log_2 p_iH(X)=i=1npilog2pi

2.1 公式解释

  • 负号:因为 pi∈[0,1]p_i \in [0, 1]pi[0,1],所以 log⁡2pi≤0\log_2 p_i \leq 0log2pi0,负号确保熵是非负值。
  • 对数:通常使用以2为底的对数(单位为比特,bit),表示信息量的度量。也可以用自然对数(单位为纳特,nat)。
  • 概率 pip_ipi:表示事件 xix_ixi 发生的可能性。
  • 求和:对所有可能事件的“信息量”加权平均。

熵的单位是比特(当使用 log⁡2\log_2log2 时),表示编码一个随机变量的平均信息量。

2.2 直观理解

熵可以看作是“预测一个随机变量结果所需的平均信息量”:

  • 如果一个事件确定发生(例如, P(X=x1)=1,P(X=xi)=0 for i≠1P(X = x_1) = 1, P(X = x_i) = 0 \text{ for } i \neq 1P(X=x1)=1,P(X=xi)=0 for i=1),熵为0,因为没有不确定性。
  • 如果所有事件等概率发生(例如,抛公平硬币, P(正面)=P(反面)=0.5P(\text{正面}) = P(\text{反面}) = 0.5
下载方式:https://pan.quark.cn/s/a4b39357ea24 布线问题(分支限界算法)是计算机科学和电子工程领域中一个广为人知的议题,它主要探讨如何在印刷电路板上定位两个节点间最短的连接路径。 在这一议题中,电路板被构建为一个包含 n×m 个方格的矩阵,每个方格能够被界定为可通行或不可通行,其核心任务是定位从初始点到最终点的最短路径。 分支限界算法是处理布线问题的一种常用策略。 该算法与回溯法有相似之处,但存在差异,分支限界法仅需获取满足约束条件的一个最优路径,并按照广优先或最小成本优先的原则来探索解空间树。 树 T 被构建为子集树或排列树,在探索过程中,每个节点仅被赋予一次成为扩展节点的机会,且会一次性生成其全部子节点。 针对布线问题的解决,队列式分支限界法可以被采用。 从起始位置 a 出发,将其设定为首个扩展节点,并将与该扩展节点相邻且可通行的方格加入至活跃节点队列中,将这些方格标记为 1,即从起始方格 a 到这些方格的距离为 1。 随后,从活跃节点队列中提取队首节点作为下一个扩展节点,并将与当前扩展节点相邻且未标记的方格标记为 2,随后将这些方格存入活跃节点队列。 这一过程将持续进行,直至算法探测到目标方格 b 或活跃节点队列为空。 在实现上述算法时,必须定义一个类 Position 来表征电路板上方格的位置,其成员 row 和 col 分别指示方格所在的行和列。 在方格位置上,布线能够沿右、下、左、上四个方向展开。 这四个方向的移动分别被记为 0、1、2、3。 下述表格中,offset[i].row 和 offset[i].col(i=0,1,2,3)分别提供了沿这四个方向前进 1 步相对于当前方格的相对位移。 在 Java 编程语言中,可以使用二维数组...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱看烟花的码农

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值