华为ECS详解
系列文章
虚拟化资源
在了解了诸多存储设备之后,现在来进一步了解核心的计算资源ECS,以华为文档为例:
弹性云服务器(Elastic Cloud Server,ECS)是由CPU、内存、操作系统、云硬盘组成的基础的计算组件。弹性云服务器的开通需要指定CPU、内存、操作系统、规格、网络配置、登录鉴权方式,同时也可以根据需求随时调整弹性云服务器的规格。
- CPU、内存和规格,请参见规格清单(x86)、规格清单(鲲鹏)。
- 操作系统,请参见镜像类型。
- 登录方式,请参见登录Linux ECS和登录Windows ECS。
vCPU实例规格(华为磁盘增强型D7)
所谓一个实例就是一个虚拟机VM,其有可能调用了多个vCPU,现在先来看计算资源规格:
- CPU/内存配比:1:4
- vCPU数量范围:4-64
- 处理器:第三代英特尔® 至强® 可扩展处理器
- 基频/睿频:2.6GHz/3.4GHz
- 支持开启/关闭超线程功能,详细内容请参见开启/关闭超线程
首先CPU/内存配比指的是vCPU,也就是固定了计算和IO的比值,用于预估瓶颈(比如IO到瓶颈但CPU还有冗余),此时如果改变vCPU的数量,内存也会等比例扩大以确保资源均衡;其次由于逻辑核运行在物理核之上,处理器规格直接影响每个逻辑核以及对应vCPU的性能。
最后对于HT超线程,在华为云的实例创建以及计价页面,其核数均为逻辑核(即vCPU数),如果关闭超线程,进入实例之后会发现核数减半,因为超线程下每个物理核可以对应两个逻辑核,关闭之后只能对应一个。
关于HT:主要取决于是I/O密集还是计算密集
HPC 负载往往是高度计算密集型,如 BLAS 矩阵运算、科学模拟等,这类任务主要做浮点计算,不会等待 I/O 或缓存而停顿。在这种情况下,开启 HT 会使两个逻辑线程共享同一个物理核的执行资源,反而可能造成资源竞争,降低效率。
数据库系统通常包含大量 I/O、网络请求、锁等待等操作,它们会使 CPU 核心有“空闲”时间。开启 HT 可以让一个物理核心在一个线程等待时,另一个线程继续执行,从而更高效地利用核心资源,提升整体处理能力。
然后继续看看网络规格:
- 支持IPv6
- 超高网络收发包能力
- 实例网络性能与计算规格对应,规格越高网络性能越强
- 最大网络收发包:850万PPS
- 最大内网带宽:42Gbps
- 最大网络连接数:500万
首先是最大网络收发包和最大内网带宽,对于PPS和带宽的关系可以类比存储中IOPS和带宽,分别有各自的瓶颈:最大网络收发包能力表示网络接口每秒可处理的最大数据包数量,是评估小包处理能力的核心指标,尤其对低延迟、高并发流量场景非常重要,拥有 850 万 PPS 表示:
- 若使用最小包(如 64 字节),理论带宽可能仅 约 4.3 Gbps
- 如果是大包(如 1500 字节),则能达约 102 Gbps 的总吞吐
这说明 PPS 更关注“包处理能力”,带宽则是“数据量能力”,两者都重要但侧重点不同
注意带宽一般是说内网带宽,因为云场景一般强调在同一地域或 VPC 内部互联传输的带宽,这种连接一般基于高性能专属网络,由云平台提供,无需额外配置或付费。这部分带宽直接关联实例性能
而若是面对公网,则会受到公网出口的额外带宽与流量限制,这无关实例瓶颈
更多实例类型(鲲鹏系列)
在上一节了解了一个具体实例的各个参数的意义之后,我们来看一下华为云国产鲲鹏系列的云计算资源类型,基本上分为:
我们首先看通算增强型,kc2.40xlarge.4.physical我们从命名上来看,有几个部分,kc2代表鲲鹏(‘k’)第二代通算资源(‘c’ means common),第二个字段分为small、large、(n)xlarge,分别代表一个vCPU,2个vCPU以及个vCPU,而下一个字段有.2、.4两个选择为CPU/内存比,最大为4x,而最后的.physical意味着是否裸金属服务器,其受裸机硬件限制,CPU和内存固定(一般整机出租)
再看看AI推理加速型,kai1s.12xlarge.2命名规则类似,其主要基于鲲鹏920以及Ascend 310芯片的组合(每张Atlas 300I加速卡包含4个Ascend310芯片),而命名中只有vCPU和内存的规格,Ascend 310芯片个数单独标出
概念:Region和AZ
- 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。
- 可用区(AZ,Availability Zone):一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。

