拓扑数据分析的新兴挑战与机遇
1. 拓扑数据分析面临的挑战与需求
随着科技发展,拓扑数据分析面临着前所未有的技术挑战,这些挑战无法通过简单扩展现有框架来解决,同时还会对数据分析算法施加新的约束。不过,这也带来了全新的模拟应用,产生了需要分析的新型数据。这两方面的挑战要求我们深入重新审视数据分析的核心算法,意味着拓扑数据分析研究需要全面重启。
2. 新兴约束
2.1 硬件约束
下一代超级计算机的预估显示,数据吞吐量(预计达 10¹² 字节/秒)与持久存储(10¹⁰ 字节/秒)或全球网络带宽之间的不平衡将加剧。数据产生速度远超存储和传输能力,传统离线后处理不再可行。为避免这一瓶颈,需要将数据分析算法尽可能靠近输入源(数值模拟算法),即采用原位数据处理策略。这一策略对拓扑数据分析算法提出了适应硬件规格的要求,特别是要扩展到并行计算模型,包括:
1. 具有统一内存访问的共享内存并行性(常见于从手持设备到工作站和超级计算机的多核环境);
2. 具有非统一内存访问的共享内存并行性(常见于高端工作站和超级计算机的多处理器环境);
3. 分布式内存并行性(常见于超级计算机的多节点环境)。
每种并行性在内存传输管理上的难度逐渐增加。拓扑数据分析算法本质上是顺序的,浮点运算少,依赖全局数据访问,因此适应这些并行性是重大算法挑战。此外,超级计算机的能耗也是重要问题,多数拓扑数据分析算法受内存限制,开发内存高效的并行算法是关键。
初步研究聚焦于轮廓树和 Reeb 图。此前对轮廓树构建算法的并行化尝试存在局限性,而 Gueunet 等人提出的算法能在四面体网格上进行快速、共享内存多线程计算,计算增强轮廓树,采
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



