使用小型应用程序提高应用程序性能混合并行编程范式的比较(英文).pdf

本文探讨了利用迷你应用程序来提高应用程序性能的方法,特别是针对美国国家航空航天局(NASA)开发的复杂流动分析代码VULCAN。文章比较了混合并行编程模式,包括消息传递接口(MPI)结合共享 MPI (SMPI) 和 MPI 结合 OpenMP。
研究的目的是寻找最有效的并行策略,在不修改整个代码的情况下,通过迷你应用程序快速探索各种选项。迷你应用程序使用了Householder反射器内核来求解线性方程组,该内核也常用于VULCAN中。
文章详细介绍了迷你应用程序的设计原则,包括接受通用输入、验证数值结果、测量性能以及调整优化参数。特别关注了如何并行化Householder 例程,通过将问题分解成多个块,并利用OpenMP和SMPI进行共享内存访问。
性能评估在Turing多节点高性能计算集群上进行,考察了节点数量、MPI任务数、OpenMP线程数以及块大小等参数对性能的影响。结果表明,MPI+SMPI通常能获得最佳执行性能,尽管需要更多的代码修改。MPI+SMPI的最大加速比为23倍,而MPI+OpenMP的最大加速比仅为11倍。
文章强调,SMPI因其较低的开销而受益,但编程复杂性较高。此外,还发现最佳输入大小(n)对于SMPI会随着节点数量而变化,这是一个意外的结果,需要进一步调查。循环分块(loop blocking)在没有共享内存并行性的情况下表现出适度的加速,表明针对缓存性能进行优化在某些情况下是有益的。
总之,本文通过迷你应用程序比较了MPI+OpenMP和MPI+SMPI两种混合并行编程范例,并得出结论,SMPI在VULCAN代码的Householder内核的优化中具有更高的潜力,尽管它需要更多的编程工作量。该研究提供了有价值的见解,可用于优化其他高性能计算应用程序。
相关报告
-
1013.81 KB 5页 社交网站使用与青少年抑郁_社会比较和自我概念清晰性的链式中介作用_丁倩.pdf
-
843.64 KB 13页 2024年为AI助力的应用程序建立治理框架白皮书.pdf
-
8.67 MB 89页 Manus AI智能体:AGI发展新范式的实践与测评-智昇人工智能研究院-202503.pdf
-
941.59 KB 67页 非洲司法中的女性:对14个国家女法官的比较研究(英)-2024.pdf
-
4.85 MB 119页 20231106-混沌学园-贝叶斯定理及其应用:在不确定的世界里提高成功概率.pdf
-
1.12 MB 11页 混合思想视角下的重庆工业遗产更新探究.pdf
-
6.14 MB 52页 小红书种草方法论:营销的第三种范式-小红书x科特勒-202403.pdf
-
2.57 MB 48页 食品、饮料与烟草行业消费比较研究系列:白银时代,探寻国内调味品的下半场.pdf
-
5.53 MB 19页 2024土地剩余使用年限对于房地产价格的影响报告-仲量联行-202401.pdf
-
1.84 MB 41页 牛津经济研究院-中国取消和提高关税对美国经济和就业的影响-2023.11.pdf
-
2.68 MB 47页 2023百度生成式AI浪潮中的长效经营新范式-百度营销&益普索-45页.pdf
-
13.18 MB 60页 2023年新消费品牌的中国范式-巨量算数-202308.pdf
-
4.23 MB 38页 坐班+远程:中国内地的混合办公模式-戴德梁行-202307.pdf
-
1.6 MB 18页 高通:2023混合AI是AI的未来白皮书(第一部分).pdf
-
733.01 KB 6页 一种提高方位装订精度的初始对准方法研究.pdf
-
5.08 MB 60页 医药行业创新药盘点系列报告(17):引领现代制药的第三波浪潮,小核酸药物带来全新治疗范式