系列文章

  1. SFS与CBR
  2. ECS,EVS以及OBS
  3. 华为ECS详解

虚拟化资源

在了解了诸多存储设备之后,现在来进一步了解核心的计算资源ECS,以华为文档为例:

弹性云服务器(Elastic Cloud Server,ECS)是由CPU、内存、操作系统、云硬盘组成的基础的计算组件。弹性云服务器的开通需要指定CPU、内存、操作系统、规格、网络配置、登录鉴权方式,同时也可以根据需求随时调整弹性云服务器的规格。

vCPU实例规格(华为磁盘增强型D7)

所谓一个实例就是一个虚拟机VM,其有可能调用了多个vCPU,现在先来看计算资源规格:

  • CPU/内存配比:1:4
  • vCPU数量范围:4-64
  • 处理器:第三代英特尔® 至强® 可扩展处理器
  • 基频/睿频:2.6GHz/3.4GHz
  • 支持开启/关闭超线程功能,详细内容请参见开启/关闭超线程

首先CPU/内存配比指的是vCPU,也就是固定了计算和IO的比值,用于预估瓶颈(比如IO到瓶颈但CPU还有冗余),此时如果改变vCPU的数量,内存也会等比例扩大以确保资源均衡;其次由于逻辑核运行在物理核之上,处理器规格直接影响每个逻辑核以及对应vCPU的性能。

最后对于HT超线程,在华为云的实例创建以及计价页面,其核数均为逻辑核(即vCPU数),如果关闭超线程,进入实例之后会发现核数减半,因为超线程下每个物理核可以对应两个逻辑核,关闭之后只能对应一个。

关于HT:主要取决于是I/O密集还是计算密集

HPC 负载往往是高度计算密集型,如 BLAS 矩阵运算、科学模拟等,这类任务主要做浮点计算,不会等待 I/O 或缓存而停顿。在这种情况下,开启 HT 会使两个逻辑线程共享同一个物理核的执行资源,反而可能造成资源竞争,降低效率。

数据库系统通常包含大量 I/O、网络请求、锁等待等操作,它们会使 CPU 核心有“空闲”时间。开启 HT 可以让一个物理核心在一个线程等待时,另一个线程继续执行,从而更高效地利用核心资源,提升整体处理能力。

然后继续看看网络规格:

  • 支持IPv6
  • 超高网络收发包能力
  • 实例网络性能与计算规格对应,规格越高网络性能越强
  • 最大网络收发包:850万PPS
  • 最大内网带宽:42Gbps
  • 最大网络连接数:500万

首先是最大网络收发包和最大内网带宽,对于PPS和带宽的关系可以类比存储中IOPS和带宽,分别有各自的瓶颈:最大网络收发包能力表示网络接口每秒可处理的最大数据包数量,是评估小包处理能力的核心指标,尤其对低延迟、高并发流量场景非常重要,拥有 850 万 PPS 表示:

  • 若使用最小包(如 64 字节),理论带宽可能仅 约 4.3 Gbps
  • 如果是大包(如 1500 字节),则能达约 102 Gbps 的总吞吐

这说明 PPS 更关注“包处理能力”,带宽则是“数据量能力”,两者都重要但侧重点不同

注意带宽一般是说内网带宽,因为云场景一般强调在同一地域或 VPC 内部互联传输的带宽,这种连接一般基于高性能专属网络,由云平台提供,无需额外配置或付费。这部分带宽直接关联实例性能

而若是面对公网,则会受到公网出口的额外带宽与流量限制,这无关实例瓶颈

更多实例类型(鲲鹏系列)

在上一节了解了一个具体实例的各个参数的意义之后,我们来看一下华为云国产鲲鹏系列的云计算资源类型,基本上分为:

我们首先看通算增强型,kc2.40xlarge.4.physical我们从命名上来看,有几个部分,kc2代表鲲鹏(‘k’)第二代通算资源(‘c’ means common),第二个字段分为small、large、(n)xlarge,分别代表一个vCPU,2个vCPU以及(n)×4(n)\times4个vCPU,而下一个字段有.2.4两个选择为CPU/内存比,最大为4x,而最后的.physical意味着是否裸金属服务器,其受裸机硬件限制,CPU和内存固定(一般整机出租)

再看看AI推理加速型,kai1s.12xlarge.2命名规则类似,其主要基于鲲鹏920以及Ascend 310芯片的组合(每张Atlas 300I加速卡包含4个Ascend310芯片),而命名中只有vCPU和内存的规格,Ascend 310芯片个数单独标出

概念:Region和AZ

  • 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。
  • 可用区(AZ,Availability Zone):一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。