并行编程与多组学数据分类中的数据分析策略
在生物医学和计算科学领域,为了更深入地理解疾病机制和处理复杂的生物数据,研究人员不断探索新的方法和技术。本文将介绍两个方面的研究内容,一是关于多发性硬化症(MS)模型的并行编程敏感性分析,二是多组学数据分类中的分层相对表达分析。
1. 多发性硬化症模型的并行编程敏感性分析
1.1 计算环境
研究人员使用 C 编程语言实现了之前工作中提出的数值模型。代码使用 gcc 9.4.0 版本编译,并启用了 -O3 优化标志。同时,借助 Python 库 SALib 实现了二阶 Sobol 方法,使用 Python 3.9.13 执行。代码在 3.30 GHz 的 Intel Core i5 - 12600 CPU 上运行,拥有 16 GB 主内存,可用物理核心数为 6,这也是模拟过程中使用的最大线程/进程数。
1.2 并行执行结果
为了评估并行版本代码的性能,研究人员对每个并行版本进行了十次执行,并记录了平均时钟时间、标准偏差和 95% 置信区间。以顺序版本代码的执行时间 734 ± 4.73 秒为参考,不同线程/进程数下的并行版本执行结果如下表所示:
| # of Threads | MPI - 平均时间(秒) | OMP - 平均时间(秒) | MPI - 标准偏差 | OMP - 标准偏差 | MPI - 置信区间 | OMP - 置信区间 |
| — | — | — | — | — | — | — |
| 2 | 420 | 386 | 6.13 | 5.50 | (418, 423) | (382, 390) |
| 4 | 308 | 246 | 7
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



