SpecTrees:高效无先验数据结构助力肽段鉴定
在肽段鉴定过程中,需要将实验光谱集(SE)中的每个光谱与理论光谱集(SP)中的所有光谱进行比较。为了高效完成这一任务,研究者提出了一种名为SpecTrees的新型数据结构和方法。
1. SpecTrees的主要特性
- 光谱标识 :假设每个光谱由唯一的整数光谱标识符(s - id)标识,光谱集S的大小为Ns,s - id取值范围是[0; Ns - 1]。
- 森林结构 :SpecTrees从概念上以森林(一组树)的形式存储光谱集S的所有信息。每棵树T是有根的有向树(in - tree),即子节点c通过从c到其父节点p的弧连接,根节点是唯一没有出边的节点。
- 节点信息 :SpecTrees中的每个节点vi(0 ≤ i ≤ n - 1)包含两个信息:光谱标识符s - id(取值范围[0; Ns - 1])和非负整数计数器cpti。不同节点可能包含相同的s - id,因此每个s - id可能在SpecTrees中多次出现。
- 横向路径(T - Path) :为了快速访问存储相同s - id的所有节点,SpecTrees添加了一组链表,称为横向路径(T - Path),每个s - id对应一个链表。
- 数组实现 :为了简化实现和优化代码,SpecTrees使用五个整数数组来表示:
- Id[ ] :长度为n,存
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



