首页>数码 >内容

Google发布採用A100 GPU的高效能虚拟机器A2系列

数码2021-02-12 16:02:07
最佳答案

Google宣布在Compute Engine中,推出採用Nvidia新GPU A100的虚拟机器A2系列,该系列目前有5种规格,最高规格a2-megagpu-16g搭载16颗A100 GPU,且拥有1.3 TB的系统记忆体,FP16精度运算能力达10 Petaflops。

A100是Nvidia在今年5月才推出的资料中心级GPU,其採用全新的Ampere架构,与上一代Volta架构的V100相比,A100使用新的Tensor Float 32格式,其运算速度比使用FP32的V100快10倍,而且还具有增强的16位元数学运算能力,能以比TF32快两倍的速度,支援FP16与BF16,A100除了INT8,还支援INT4与INT1的张量运算。

而且A100还提供多重执行个体群组功能(Multi-Instance Group,MIG),可以将1个GPU划分成最多7个执行个体,每个执行个体间效能以及故障相互完全隔离。每个A100 GPU提供的效能,可比上一代多20倍,而且还搭配了40 GB的高效能HBM2 GPU记忆体,Google提到,搭载A100的新虚拟机器系列A2,适合用来处理诸如CUDA机器学习训练和推论,以及高效能计算等运算密集的工作。

为了加速多GPU的工作负载,A2系列使用了Nvidia HGX A100所使用的高速NVLink,GPU对GPU频宽高达600 GB,A2虚拟机器可选搭配96个英特尔Cascade Lake vCPU、本地端SSD和100 Gbps网路连结。特别的是,A2虚拟机器在底层GPU伺服器平台架构提供vNUMA(Non-Uniform Memory Access)透明性,可以让使用者执行进阶的效能调校。

A2系列提供了5种规格,最低规的a2-highgpu-1g使用1个A100 GPU,搭配12个vCPU和85 GB的系统记忆体,而最高阶的规格a2-megagpu-16g,则一次搭载16颗A100 GPU,拥有640 GB的GPU记忆体,并使用96个vCPU配置1.3 TB的系统记忆体,NVLink总频宽高达9.6 TB/s,这个效能怪兽单个执行个体,能以FP16精度提供10 Petaflops运算能力,而Int8更高达20 PetaOps。

免责声明:本文由用户上传,如有侵权请联系删除!