数学基础:对数的应用与生物信息学案例
1. 对数在概率乘法中的应用
对数最初是作为计算辅助工具被发明的,它将乘法问题转化为加法问题。例如,要计算乘积 $p = x · y$,可以先计算对数之和 $s = \log_b x + \log_b y$,然后取对数的逆运算(即 $b$ 的 $s$ 次幂)得到 $p$,因为 $p = x · y = b^{(\log_b x + \log_b y)}$。
在处理长链概率乘法时,这种方法尤为重要。概率通常是较小的数,长链概率相乘会得到极小的数,这在实际计算机的浮点乘法中会导致严重的数值稳定性问题。而对概率的对数求和在数值上更加稳定,并且能得到等价的结果,即 $\prod_{i = 1}^{n} p_i = b^P$,其中 $P = \sum_{i = 1}^{n} \log_b(p_i)$。如果需要得到实际概率,可以对求和结果进行指数运算,但通常在比较两个概率大小时,直接比较对数大小即可,因为较大的对数对应较大的概率。
需要注意的是,除了 $\log(1) = 0$ 外,概率的对数都是负数,这就是为什么包含概率对数的方程中常常会在奇怪的地方出现负号。
以下是对数在概率乘法中应用的流程:
1. 计算每个概率的对数。
2. 将这些对数相加。
3. 如果需要实际概率,对求和结果进行指数运算。
2. 对数与比率
比率是形如 $a/b$ 的量,在数据集里常作为基本特征或由特征对导出的值出现。比率在数据归一化时自然产生,比如根据条件(如某种处理后的重量与初始重量之比)或时间(如今日价格与昨日价格之比)进行归一化。
然而,比率在反映增加和减少时
超级会员免费看
订阅专栏 解锁全文
1083

被折叠的 条评论
为什么被折叠?



