首页 >科技 > 内容

模拟百亿亿次的恒星需要HIP解决方案

科技 2020-04-08 11:27:45

由于GPU体系结构已经成为科学计算的标准,应用团队不得不改造他们的科学代码以在新系统上运行。 即使是已经为GPU重新设计代码的团队,也必须不断地将它们适应新的体系结构。

然而,普林斯顿大学的埃文·施耐德从一开始就开始为GPU开发代码。 2012年,施耐德面临着如何利用GPU集群解决巨大天体物理学问题的挑战。 开始在亚利桑那大学的小集群与她的博士顾问布兰特·罗伯逊-目前是加州大学圣克鲁斯分校的副教授-最终运行在现在已退役的Cray XK7泰坦超级计算机在橡树岭领导计算设施(OLC F),美国能源部(DOE)办公室的科学用户设施位于能源部的橡树岭国家实验室。 代码-所谓的Cholla,或∥(并行)体系结构上的计算流体力学-现在是第一批被重写的代码之一,这是一个将于2021年部署在OLCF的exascale系统。

施奈德说:“有了Frontier,GPU就会有更多的电源。” “在CPU上做几乎任何事情都是没有意义的,所以我们正在做的很多事情是让我们的一些额外的物理模块运行在GPU上。”

该代码是加速应用准备中心(CAAR)中的八个之一,该中心致力于为前沿科学应用做准备。 乔拉被用来模拟参与星系进化的物理系统,这就是宇宙中的星系如何随时间变化。 星系不仅由恒星组成,而且还由尘埃和气体相互作用以影响这种进化。 该团队的目标是运行一个银河系的模拟,它包含了所有的气体物理,除了所有的恒星。

施奈德说:“我们需要高分辨率的模型,因为我们真的想跟踪气体的所有不同阶段-温暖、冷、热、高速等等。” “我们想了解推动恒星形成的气体物理学,以及为什么星系停止形成恒星。 为了利用我们已经拥有的观测数据,我们需要做一个非常大的模拟。”

目前,Cholla与NVIDIA的CUDA编程语言兼容,在OLCF的IBMCAC922峰会系统上运行,该系统具有NVIDIA特斯拉V100GPU。 现在,施耐德和她的团队,在OLCF的科学计算小组中与CAAR联络员鲁本·布迪亚贾以及AMD和Cray的代表一起,正在使用异构计算接口进行可移植性(HIP),以实现其名称所建议的-将某些代码转换为边界体系结构可移植的部分,这些代码将具有Cray的Shasta体系结构和Slingshot互连以及AMDEPYC CPU和AMD Radeon不稳定。 这个翻译过程让像施耐德这样的用户适应新的GPU架构,如Frontier。

施耐德的研究生,匹兹堡大学的奥兰多·沃伦-施耐德最近接受了助理教授的职位-已经改写了大部分GPU部分的代码,以兼容HIP。 接下来,团队将重写目前在CPU上运行的Cholla片段,以便这些片段也可以在GPU上运行。

罗伯逊正在与他的研究生布鲁诺·维拉斯诺合作,他正在向乔拉添加大量的作品,包括在团队的巨型银河模拟中解决重力所需的计算。 施耐德正在协调重新设计代码的努力,并添加她所称的“铃铛和口哨”,以进一步完善理解恒星形成所需的模拟。

与Frontier,团队相信他们将能够以高分辨率模拟恒星形成..

“现在,我们想确定气体是如何离开银河系并返回银河系的,以及这对银河系恒星形成过程的影响。 我们能得到的分辨率越高,我们就能更好地理解气体的物理过程,最终影响到天体物理学中的许多不同问题。”

施奈德说,最后一步是确保新代码在传输到数千个GPU时有效,而不是只运行几个GPU,这一任务需要像峰会这样的大规模高性能计算系统。 该团队将在峰会上进行大规模测试,然后在明年部署的前沿系统上运行。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。