26、应用编辑距离进行树木年轮序列匹配

应用编辑距离进行树木年轮序列匹配

在树木年代学中,匹配树木年轮宽度序列(交叉定年)是一个重要问题。传统方法假设树木每年只形成一个年轮,可通过简单的 $\theta(mn)$ 算法完成匹配,但实际情况中可能存在缺失或双年轮,这就需要更复杂的算法。

编辑距离的归一化与评判标准

编辑距离会根据执行的编辑操作类型和序列的部分重叠情况而变化,因此需要将编辑距离除以添加项的数量(即转换后样本序列的长度)进行归一化。然而,简单比较所有归一化编辑距离(排序并取最小值作为最佳结果)并不实用,因为归一化会消除序列长度的信息,导致较短序列更容易获得较好的编辑距离。

由于 $t$ 值与长度相关,且是树木年代学中常用的距离度量,所以将转换后序列与主序列之间的 $t$ 值作为评判标准。在填充盒子的过程中,可以渐近地隐式计算相关系数。对每个盒子的最后一行和最后一列的所有 $t$ 值进行排序,并将最大的 $t$ 值、最优转换(即可能缺失和双年轮的位置)以及相应的定年建议(偏移量)输出给用户。

结果的启发式后处理

之前描述的算法在最后简单地对所有结果进行排序,而不考虑编辑操作的数量,这会导致最佳结果往往包含过多的编辑操作。一种标准方法是通过乘法或加法项对编辑操作进行惩罚,但这也会影响正确位置的编辑操作,而且错误的编辑操作似乎对惩罚更具鲁棒性。

因此,不惩罚编辑操作,而是在启发式后处理步骤中比较获得的结果。将每个 $\alpha$ 盒子各层的最后一行和最后一列的所有编辑距离存储在一个总体结果结构中。通常,一个好的定年结果会在最佳结果中多次出现,这些相似结果仅在一些编辑操作上有所不同,它们通常共享一些正确的编辑操作,并包含一些能稍微改善编辑距离但实际上不

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值