78、并行编程与多组学数据分类中的数据分析策略-优快云博客

本文链接：https://blog.youkuaiyun.com/prometheus9mon/article/details/152161639

并行编程与多组学数据分类中的数据分析策略

在生物医学和计算科学领域，为了更深入地理解疾病机制和处理复杂的生物数据，研究人员不断探索新的方法和技术。本文将介绍两个方面的研究内容，一是关于多发性硬化症（MS）模型的并行编程敏感性分析，二是多组学数据分类中的分层相对表达分析。

1. 多发性硬化症模型的并行编程敏感性分析

1.1 计算环境

研究人员使用 C 编程语言实现了之前工作中提出的数值模型。代码使用 gcc 9.4.0 版本编译，并启用了 -O3 优化标志。同时，借助 Python 库 SALib 实现了二阶 Sobol 方法，使用 Python 3.9.13 执行。代码在 3.30 GHz 的 Intel Core i5 - 12600 CPU 上运行，拥有 16 GB 主内存，可用物理核心数为 6，这也是模拟过程中使用的最大线程/进程数。

1.2 并行执行结果

为了评估并行版本代码的性能，研究人员对每个并行版本进行了十次执行，并记录了平均时钟时间、标准偏差和 95% 置信区间。以顺序版本代码的执行时间 734 ± 4.73 秒为参考，不同线程/进程数下的并行版本执行结果如下表所示：
| # of Threads | MPI - 平均时间（秒） | OMP - 平均时间（秒） | MPI - 标准偏差 | OMP - 标准偏差 | MPI - 置信区间 | OMP - 置信区间 |
| — | — | — | — | — | — | — |
| 2 | 420 | 386 | 6.13 | 5.50 | (418, 423) | (382, 390) |
| 4 | 308 | 246 | 7