36、Bloom Filter在生物信息学中的应用与挑战

Bloom Filter在生物信息学中的应用与挑战

1. 生物信息学中的Bloom Filter技术

Bloom Filter是一种简单的数据结构,因其低时间和空间复杂度,在处理包含大量重复数据的基因组数据时表现出色。它并非独立技术,但与其他技术结合使用时,能成为适应性很强的数据结构。目前,Bloom Filter在生物信息学的多个领域得到了广泛探索。

2. 特定的生物信息学工具
  • Kollector :这是一种无比对的靶向组装管道,使用渐进式布隆过滤器(Progressive Bloom Filter,PBF)。它有两个阶段,第一阶段是标记,扫描一组基因组读数以选择具有特定长度k - mer重叠的读数对,重叠长度由用户定义;第二阶段是管道,PBF根据固定的读数长度帮助选择具有k - mer重叠的读数。不过,PBF存在偏差,对输入文件中的读数排列敏感。Kollector还实现了ABySS和GMAP进行支架构建,并维护多个参数来控制错误读数的数量。但它偏向于短k - mer,无法重建长读数,例如约20 kbp的读数,原因是它无法识别外显子被长内含子分隔的读数。此外,作为贪心算法,它会选择脱靶区域的读数,并且由于PBF,会选择相对不同的序列。
  • ABySS 2.0 :是ABySS 1.0的新版本,为多阶段从头测序管道。与ABySS 1.0相比,它实现了级联布隆过滤器(cascading Bloom Filter)来减少内存需求并去除错误的k - mer。该过滤器用于表示德布鲁因图(de Bruijn graph),有三个阶段:单元化(uniting)、重叠群(contig
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值