首页>科技 >内容

GCP的HPC工作负载管理器Slurm现支援先占式虚拟机器

科技2021-02-24 08:05:22
最佳答案

Google为GCP上的HPC工作负载管理器Slurm加上新功能,包括先占式虚拟机器、自定义机器类型、映像档执行个体扩展、可附加GPU,以及可自定义的NFS挂载,另外,这个版本还改进了部署的可扩展性和弹性。

Slurm是开源HPC工作负载管理器,全球TOP500超级电脑中有约60%採用,Slurm能够为用户分配专用以及非专用的资源,并提供一个能启动、执行以及监控节点任务运作的框架,也能为任务伫列合理地分配资源。Google在Compute Engine上提供的Slurm丛集,能根据工作需求以及伫列深度自动扩展丛集,并且可以使用Slurm将本地丛集的工作,联合云端Compute Engine执行的Slurm丛集一同工作。

GCP使用者现在可以使用先占式虚拟机器以及Slurm来扩展Compute Engine丛集,对自定义的机器类型,也能以最佳化的CPU以及记忆体资源,在执行个体上运作使用者的工作负载,Google表示,这两项功能可以帮助使用者,降低HPC工作负载的成本,因为先占式虚拟机器比一般执行个体便宜80%,和预定义的机器类型相比,自定义机器类型又可以节省50%以上的成本。

使用者还能根据Google提供的磁碟映像档创建Slurm执行个体,比起从网际网路安装套件并应用脚本配置,可以大幅缩短配置每个节点的时间,同时也提高部署弹性。映像档是透过配置映像档创建节点自动生成的,并作为其他自动扩展执行节点的基础,Google表示,这样的方法可以在7分钟内产生5,000个节点。

由于Compute Engine支援各种GPU,使用者可以根据区域可用性,附加到执行个体中。这次的更新,Slurm会根据GPU的型号和相容性,自动安装适当的驱动程式和软体,使得Slurm能在Compute Engine上扩展GPU工作负载。另外,使用者也可以为NFS主机选择储存服务,并指定既存VPC或是共享VPC来託管丛集。

免责声明:本文由用户上传,如有侵权请联系删除!