22、生物信息学工具性能与基因组重排模型研究

QuietPulse

于 2025-10-01 16:56:13 发布

阅读量20

点赞数

CC 4.0 BY-SA版权

分类专栏：生物信息学算法前沿文章标签：生物信息学 k-mer计数 Gerbil

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c2d3e4f/article/details/153555684

生物信息学算法前沿专栏收录该内容

40 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

生物信息学工具性能与基因组重排模型研究

1. k - mer 计数工具性能评估

1.1 k - mer 处理流程

在处理 k - mer 时，会顺序存储那些无法插入的 k - mer。当临时文件中的所有 k - mer 都处理完毕后，会通过排序和压缩的方法对该区域内的 k - mer 进行计数。不过，仍有可能超出可用的 GPU 内存。在这种情况下，会将该区域内的所有 k - mer 复制回主内存，并存储在临时文件中，这与 CPU 的应急处理类似，但这种操作成本很高。在处理实际数据集时，几乎未观察到 GPU 错误处理情况，CPU 错误处理的执行次数也很少。

1.2 实验设置

为了测试相关工具的性能，使用了与他人相同的实例进行实验。对于每个数据集，分别对 k = 28、40、56 和 65 的所有 k - mer 进行计数，并将 Gerbil 的运行时间与 KMC2（版本 2.3.0）和 DSK（版本 2.0.7）进行比较。此外，还使用了合成测试集 GRCh38，该数据集由 Genome Reference Consortium Human Reference 38 创建，从中均匀采样了大小为 1000 的 k - mer，目的是测试更大 k 值下的性能。为了评估不同硬件上的性能，实验在两台不同的台式计算机上进行，具体硬件配置如下表所示：

系统	CPU	RAM	GPU	工作磁盘	可用磁盘空间	操作系统

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。