基于硬币列表的埃文斯抽样公式重构
1. 生物学描述差异与中国餐馆过程
在生物学中,相关描述与一般情况存在两点差异:
- 突变率并非固定值,而是由参数 θ 决定。
- 特征数量并非以有顺序的列表形式呈现,而是以无顺序的多重集(即划分)形式存在。
这种(参数化)突变的概率描述最早由沃伦·埃文斯在 1972 年提出,后续诸多研究都以此为起点。本文所关注的列表求和公式在早期研究中并未出现,因为早期研究未使用列表。
此外,本文所述情况还有一种描述,即中国餐馆过程。假设一家餐馆有任意数量的桌子排成一排,每张桌子可坐任意数量的人。某一时刻餐馆的情况由一个非负数字列表 ⟨n0, n1, …, nk - 1⟩ 决定,其中 ni 表示第 i 张桌子上的人数。当新顾客到来时,有以下两种可能情况,且各自有一定概率:
- 新顾客以与某张已有人坐的桌子上人数 ni 成正比的概率加入该桌子。
- 新顾客开启一张新桌子,成为唯一的就座者,新桌子可插入现有桌子队列的任意位置。这第二种情况即为突变情况。
2. 添加突变率参数
生物学家早已关注到基于通道的转换中固有的概率突变。在这部分,我们通过一个大于 0 的突变参数 θ 以更灵活的方式整合这些突变,并将其融入参数化的硬币添加通道。
设 θ ∈R>0 为突变参数,硬币添加通道将被修改为参数化通道:
[
L(N_{>0})\xrightarrow{ca(\theta)}D(L(N_{>0}))
]
其定义为:
[
ca(\theta)(\ell) := \sum_{0\leq i
超级会员免费看
订阅专栏 解锁全文
2333

被折叠的 条评论
为什么被折叠?



