华为系算力卡产品调研
系列文章
华为算力卡产品
首先先来看国产的算力卡(支持国产),先以华为为例,在深入了解之前,我们先来看一下其产品的命名规则:
主流产品
从Ascend官网产品来看,其市售产品主要分类以及对应产品目录如下:
Atlas 系列命名结构
Atlas + [系列数字] + [分类后缀] + [版本/代次标识] |
系列数字:
200、300、500、800、900)代表产品定位(性能、规模或任务类型)
-
中心推理硬件基本为300和800型号
-
训练硬件基本为800和900型号
-
200,300,500集中于边缘计算硬件
其主要是区别产品线,从上一章的结构就可以看出来,同一个产品线基本代号一致
分类后缀:
- T:训练(Training),用于训练计算
- I:推理(Inference)
- V:视频推理(Video),本质也是推理卡,只是其显存会更大
- K、SoC 等则可能说明特殊形态或嵌入式SoC形式(没有找到K后缀的明确语义)
版本/代次标识:
-
A2、A3:代表其有Ascend加速卡嵌入以及规格上的升级(A3的资料仍待查阅)
参见Atlas 800 推理服务器(型号 3000)和Atlas 800T A2 训练服务器的产品,可以看到800T A2有八张昇腾910处理模块,而800-3000只有鲲鹏920,需要额外搭配加速卡
-
Pro:专业版或性能增强
-
Duo:双芯片/双模块
-
Box、PoD、SuperPod:部署形态:如整机箱级(Box)、集中部署集群(Pod)或超集群形式(SuprPod)
- Pod产品主要是900 A2 PoD
- SuperPoD主要是900 A3 SuperPoD,其从8个4U节点变成了4个8U节点,从两者的机柜构成图可以看出来不同(详见产品3D展示中SuperPoD和900 A2 PoD的计算机柜3D图)
注:我们会发现有的命名为Atlas xxx,而有的直接命名位A xxx;原因是因为A xxx主要是内部测试型号,而非市售代号,对于其支持中心所提供的型号中,许多产品已经结束其生命周期
从一些细节来看,对于900系列,Atlas 900 A2 PoD其实就是多个Atlas 800T A2的集群机柜,从两者的3D结构中可以看到一个Atlas 800T A2为4U8N的结构,而900 A2 PoD单个机柜能承载8个4U计算节点,即单机柜32U64N,而其性能是否是单节点的8倍,还得看其互联性能。
其次对于其推理卡和训练卡,即后缀为T或者I,目前从搭载的Ascend910Bx型号来看,推理卡显存被阉割,其细分使用场景很细节,一般来说显存和显存带宽的降低会带来低精度算力的腰斩,可能对高精度没有影响(高精度瓶颈在计算单元)
Ascend芯片型号
其主要有Ascend 310(常用于边缘计算)以及Ascend 910(常用于数据中心)以及诸多变种版本。
Ascend310系列
Ascend310(基本淘汰)
B系列
Ascend310B1
Ascend310B2
Ascend310B3(Atlas200I A2芯片)
Ascend310B4
P系列
Ascend310P1(Atlas300I Pro、Atlas300V Pro)
Ascend310P3(*2 ——>Atlas300I DUO卡 48G)
Ascend910系列
A系列
Ascend910A—————————————————————32G显存
Ascend910B (不带数字,还是A系列) —————————32G显存
Ascend910ProA(Pro系列,cube_freq较前代提升100)——32G显存
Ascend910ProB(Pro系列,看似910B,实则910A) ———32G显存
Ascend910PremiumA —————————————————32G显存
B系列(主要用于A2系列)
Ascend910B1(Atlas800T A2 训练卡)——————64G显存
Ascend910B2(Atlas800T A2 训练卡)——————64G显存
Ascend910B3(Atlas800T A2 训练卡)——————64G显存
Ascend910B4(Atlas800I A2 推理卡)——————32G显存
C系列(应该用于Atlas 800 A3 系列)
Ascend910C1
Ascend910C2
Ascend910C3
Ascend910C4
技术与规格
参考文章:
Ascend芯片类型 I
华为升腾显卡选型备忘
Ascend计算产业链概述
产品3D展示
华为支持中心
LLaMa支持文档
Ascend芯片 II
