数学基础:对数、概率与基因密码
1. 对数与概率乘法
对数最初是作为计算辅助工具被发明的,它将乘法问题转化为加法问题。例如,要计算乘积 $p = x · y$,可以先计算对数之和 $s = \log_b x + \log_b y$,然后取对数的反函数(即 $b$ 的 $s$ 次幂)得到 $p$,因为 $p = x · y = b^{(\log_b x + \log_b y)}$。这一原理曾被用于机械计算尺,在袖珍计算器出现之前发挥了重要作用。
在现代,对数在处理长概率链乘法时尤为重要。概率通常是较小的数,长概率链相乘会得到极小的数,用于描述非常罕见事件的发生概率。然而,在实际计算机中进行浮点数乘法会存在严重的数值稳定性问题,数值误差会逐渐累积,最终掩盖真实值。
而对概率的对数求和在数值上更加稳定,并且能得到相同的结果。设 $p_i$ 为一系列概率,那么 $\prod_{i = 1}^{n} p_i = b^P$,其中 $P = \sum_{i = 1}^{n} \log_b(p_i)$。如果需要得到真实概率,可以对求和结果取指数,但通常情况下这并非必要。当只需比较两个概率大小时,直接比较对数大小即可,因为对数越大,对应的概率也越大。
需要注意的是,除了 $\log(1) = 0$ 外,概率的对数都是负数。例如,$\log_2(\frac{1}{2}) = -1$。这就是为什么在涉及概率对数的方程中,常常会在奇怪的地方出现负号。
2. 对数与比率
比率是形如 $a/b$ 的量,在数据集里经常作为基本特征或由特征对导出的值出现。比率常用于数据归一化,比如根据条件(如某种处理后的重量与初始重量之比)或时间(如今日价格与昨日
超级会员免费看
订阅专栏 解锁全文
1414

被折叠的 条评论
为什么被折叠?



