使用小型应用程序提高应用程序性能混合并行编程范式的比较(英文).pdf

本文探讨了利用迷你应用程序来提高应用程序性能的方法,特别是针对美国国家航空航天局(NASA)开发的复杂流动分析代码VULCAN。文章比较了混合并行编程模式,包括消息传递接口(MPI)结合共享 MPI (SMPI) 和 MPI 结合 OpenMP。
研究的目的是寻找最有效的并行策略,在不修改整个代码的情况下,通过迷你应用程序快速探索各种选项。迷你应用程序使用了Householder反射器内核来求解线性方程组,该内核也常用于VULCAN中。
文章详细介绍了迷你应用程序的设计原则,包括接受通用输入、验证数值结果、测量性能以及调整优化参数。特别关注了如何并行化Householder 例程,通过将问题分解成多个块,并利用OpenMP和SMPI进行共享内存访问。
性能评估在Turing多节点高性能计算集群上进行,考察了节点数量、MPI任务数、OpenMP线程数以及块大小等参数对性能的影响。结果表明,MPI+SMPI通常能获得最佳执行性能,尽管需要更多的代码修改。MPI+SMPI的最大加速比为23倍,而MPI+OpenMP的最大加速比仅为11倍。
文章强调,SMPI因其较低的开销而受益,但编程复杂性较高。此外,还发现最佳输入大小(n)对于SMPI会随着节点数量而变化,这是一个意外的结果,需要进一步调查。循环分块(loop blocking)在没有共享内存并行性的情况下表现出适度的加速,表明针对缓存性能进行优化在某些情况下是有益的。
总之,本文通过迷你应用程序比较了MPI+OpenMP和MPI+SMPI两种混合并行编程范例,并得出结论,SMPI在VULCAN代码的Householder内核的优化中具有更高的潜力,尽管它需要更多的编程工作量。该研究提供了有价值的见解,可用于优化其他高性能计算应用程序。
相关报告
-
31.21 MB 35页 从代码编写到意图编程:Vibe Coding,AI时代的编程范式革命-中信建投-202603.pdf
-
1013.81 KB 5页 社交网站使用与青少年抑郁_社会比较和自我概念清晰性的链式中介作用_丁倩.pdf
-
7.12 MB 58页 2026AI大压缩:智能经济时代的生产范式转移研究报告-香港大学人工智能-202606.pdf
-
11.6 MB 137页 教育部原副部长吴岩:教育的中国范式.pdf
-
15.39 MB 39页 智能座舱:定义AGI时代的汽车新范式-清华大学-202605.pdf
-
860.15 KB 100页 2026年智能体作为细胞器的进化论-基于自指余行论的“人机共生”新范式白皮书.pdf
-
4.9 MB 73页 2026中国全球基建项目中使用的钢铁与水泥绿色化转型报告.pdf
-
9.79 MB 215页 麦肯锡:下一个巨型竞技场:2040年达到29-48万亿美元的18个行业 英文.pdf
-
2.54 MB 26页 2025年公关传播人士使用生成式AI的完整指南-美通社-202506.pdf
-
843.64 KB 13页 2024年为AI助力的应用程序建立治理框架白皮书.pdf
-
8.67 MB 89页 Manus AI智能体:AGI发展新范式的实践与测评-智昇人工智能研究院-202503.pdf
-
941.59 KB 67页 非洲司法中的女性:对14个国家女法官的比较研究(英)-2024.pdf
-
4.85 MB 119页 20231106-混沌学园-贝叶斯定理及其应用:在不确定的世界里提高成功概率.pdf
-
1.12 MB 11页 混合思想视角下的重庆工业遗产更新探究.pdf
-
6.14 MB 52页 小红书种草方法论:营销的第三种范式-小红书x科特勒-202403.pdf
-
2.57 MB 48页 食品、饮料与烟草行业消费比较研究系列:白银时代,探寻国内调味品的下半场.pdf