12、系统发育估计与距离方法详解

系统发育估计与距离方法详解

1. 引言

重建生物物种间的进化关系是生物学中最古老的问题之一。尽管在过去二十年取得了一些进展,但仍存在诸多困难,如计算难题、模型参数复杂、生物数据历史差异、术语混淆等。所有系统发育估计方法都有三个关键特征:衡量树拓扑充分性的数值标准、计算分支长度的公式以及探索树空间的算法。在 R 语言中,距离法和最大似然法取得了显著进展。

2. 距离方法概述

距离方法历史悠久,对于大量数据通常易于处理。给定一个系统发育树 T,它能定义一个唯一的成对距离矩阵 Δ;但对于给定的距离矩阵,根据不同标准可定义多个树。距离法的核心问题是为给定的距离矩阵找到合适的树,其驱动思想是距离矩阵中的距离能反映观测值的相对接近程度,用于估计树的拓扑结构和分支长度。主要有两种策略:聚合最相关的观测值或拆分最远的观测集。

3. 计算距离

3.1 距离概念差异

统计距离可视为超空间中两个观测值之间的“物理”或几何距离,而进化距离是对两个单位(个体、种群或物种)之间差异的估计,通常以进化变化量(如突变数量)来衡量。

3.2 R 中计算距离的函数

R 中有不同包提供了各种计算距离的函数,具体如下表所示:
| 包 | 函数 | 数据类型 |
| — | — | — |
| stats | dist | 连续或二进制 |
| stats | cophenetic | 类为 “hclust” 或 “dendrogram” 的对象 |
| cluster | daisy | 连续和/或离散 |
| ade4 | dist.binar

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值