[云计算]HCIE-Cloud 存储虚拟化
目录云计算虚拟化中的存储架构
存储的分类
- 存储系统
- 封闭系统存储(基于大型机)
- 开放系统存储(基于Windows、Unix、Linux的服务器)
- 内置存储
- 外挂存储(按照连接方式分为以下几种,占市场大多数)
- 直接式存储(Directed-Attached Storage:DAS):采用SCSI接口,带宽限制,扩容需停机
- 网络存储(Fabric-Attached Storage:FAS):(依传输协议分)
- 网络接入存储(Network-Attached Storage:NAS):TCP/IP连接
- 存储区域存储(Storage Area Network:SAN):光纤连接
NAS
NAS的文件系统主要在存储侧,使用的网络协议主要是NFS和CIFS
-
CIFS(Common Internet File System)通用网络文件系统:由微软Smb(Server Message Block)发展而来的一个公共、开放的文件系统
-
NFS(Network File System)网络文件系统:在类Unix系统中实现网络文件共享
CIFS | NFS | |
---|---|---|
传输特点 | 基于网络,可靠性要求高 | 独立于传输 |
易用性 | 无需额外软件 | 需要安装专用软件 |
安全性 | 无法进行错误恢复 | 可以进行错误恢复 |
文件转换 | 不保留文件格式特性 | 保留文件格式特性 |
SAN
描述 | IP-SAN | FC-SAN |
---|---|---|
网络速度 | 1Gb、10Gb、40Gb | 4Gb、8Gb、16Gb |
网络架构 | 使用现有IP网络 | 单独建设光纤网络和HBA卡 |
传输距离 | 理论上没有距离限制 | 受到光纤传输距离的限制 |
管理、维护 | 与IP设备一样操作简单 | 技术和管理较复杂 |
兼容性 | 与所有IP网络设备都兼容 | 兼容性差 |
性能 | 目前主流1Gb,10Gb正在发展 | 非常高的传输和读写性能 |
成本 | 购买与维护成本都较低 | 购买(光纤交换机、HBA卡、光纤磁盘阵列等)与维护(培训人员、系统设置与监测等)成本高 |
容灾 | 本身可以实现本地和异地容灾,且成本低 | 容灾的硬件、软件成本高 |
安全性 | 较低 | 较高 |
-
IP-SAN:顾名思义,以TCP/IP协议作为底层传输协议,用以太网作为承载介质构建区域网络架构。实现IP-SAN的典型协议是iSCSI,它定义了SCSI指令集在IP中传输的封装方式
-
FC-SAN:采用Fibre Channel Protocol(光纤通道协议),服务器与存储设备间通过光纤交换机直接建立连接
传统内置存储遇到的问题
- 硬盘成为整个系统的性能瓶颈
- 槽位有限,难满足大容量需求
- 单硬盘存储数据,可靠性不高
- 存储空间利用率低
- 本地存储,数据分散,不易共享
- 可扩展性不高
- 总线结构,而非网络结构
- 可连接的设备受到限制
- 扩容的时候需要停机
优劣比较
DAS | NAS | FC-SAN | IP-SAN | |
---|---|---|---|---|
传输类型 | SCSI、FC | IP | FC | IP |
数据类型 | 块级 | 文件级 | 块级 | 块级 |
典型应用 | 任何 | 文件服务器 | 数据库应用 | 视频监控 |
优点 | 易于理解兼容性好 | 易于安装成本低 | 高扩展性高性能高可用性 | 高扩展性成本低 |
缺点 | 难以管理,扩展性有限存储空间利用率不高 | 性能较低对某些应用不适合 | 比较昂贵,配置复杂互操作性问题 | 性能较低 |
虚拟化中的存储架构
虚拟化的数据存储是将存储资源按照一定的文件系统来管理
- 虚拟化的数据存储包括
- 虚拟化本地硬盘(采用EXT4文件系统)
- 虚拟化SAN存储(使用VIMS虚拟镜像管理文件系统)
- NAS存储(使用NFS网络文件系统)
实质为块存储,包括SAN存储,本地磁盘和FusionStorage
可以简单理解为:块存储 + 文件系统 = 虚拟化存储
举个例子:SAN存储(划分逻辑卷)+ 文件系统 = 虚拟化存储
常见的虚拟机磁盘格式
虚拟机磁盘以文件的形式存放于文件系统之中,常见的虚拟机磁盘格式有以下几种
虚拟机磁盘文件格式 | 支持的厂商 |
---|---|
RAW | 各厂商通用 |
VMDK | VMware |
VHD | 微软Hyper-V、华为FusionCompute |
QCOW | QEMU或KVM虚拟化平台专用的格式 |
QED | QEMU或KVM虚拟化平台专用的格式 |
VDI | Oracle |
VHD
VHD(Virtual Hard Disk)是微软推出的一种虚拟机磁盘文件格式,VHD就是虚拟机磁盘文件。
VHD文件内容主要是虚拟机启动所需的系统文件,可被压缩成单个文件存放在系统上。
一个VHD文件代表VIMS(虚拟镜像管理系统)在虚拟机上的一个物理硬盘驱动,所有用户数据以及有关虚拟服务器的配置都存储在VHD文件中。
VHD虚拟硬盘的四种类型:
- 固定VHD:对已分配大小不会更改
- 动态VHD:大小与写入的数据大小相同,随着数据写入直至达到大小上限(2040GB)
- 差异VHD:类似动态VHD,但只包含关联父VHD修改后的硬盘快(最大2040GB)
- 链接硬盘VHD:文件本身指向一个磁盘或者一个分区
VMDK
VMDK(VMWareVirtual Machine Disk Format)VMware创建的虚拟硬盘格式,文件存放在VMware文件系统中,被称为VMFS(虚拟机文件系统)。
一个VMDK文件代表VMFS在虚拟机上的一个物理硬盘驱动。所有用户数据和有关虚拟服务器的配置信息都存储在VMDK文件中。
厚磁盘(Thick Disk):属于VMFS,创建VMDK文件时分配所有需要的空间
薄磁盘(Thin Disk):属于VMFS,创建VMDK时分配较小的空间,当写入数据增加时,动态增加存储空间
Raw
原始磁盘(Raw Disk)
VM的OS直接访问存储设备上的LUN,不属于VMFS。
不能用VADP来备份,在VM中安装备份代理来备份。
云计算中虚拟化存储转换路径
-
存储资源(Raid或者副本机制)→ 物理卷格式化(物理卷无法直接给主机使用,需要格式化)→ 主机
-
存储资源 → 物理卷逻辑划分 → 逻辑卷 (可直接挂载给主机用) → 格式化后生成NFS文件系统
或者逻辑卷(格式化挂在给集群)→ 生成虚拟文件系统 → 主机(看到的是一个共享目录)
举例:
云计算中非虚拟化存储转换路径
-
存储资源(Raid或者副本机制)→ 物理卷(逻辑划分)→ 逻辑卷(不用格式化)→ 集群(直接挂载)
→ 虚拟硬盘(无文件系统)
这个文件系统需要由上层操作系统来格式化
举例:Windows系统下新添加的一块硬盘,需要从物理卷逻辑划分出逻辑卷,然后由操作系统格式化文件系统以供用户使用。
物理磁盘
硬盘类型
硬盘类型 | 转速 | 一般容量 | 性能 |
---|---|---|---|
SATA | 5400 rpm 或 7200 rpm | 1~4TB | 普通 |
NL-SAS | 7200 rpm | 300GB/450GB/600GB | 好 |
SAS | 10k rpm 或 15k rpm | 300GB/450GB/600GB | 良好 |
SSD | 闪存读写 | 256GB/512GB | 非常好 |
机械硬盘的结构
- 硬盘的组成架构
- 磁头组件
- 用于数据的读取和写入。
- 磁头驱动机构
- 用于驱动磁头臂将磁头送达指定的位置。
- 盘片组
- 数据的载体。
- 主轴驱动装置
- 驱动盘片维持高速运转。
- 控制电路
- 系统控制、调速、驱动等。
- 磁头组件
-
盘片的逻辑结构
-
磁道
- 盘片上围绕着主轴的同心环,数据被记录在磁道上
- 从盘片的外边缘开始向内编号
- 磁道密度 TPI:盘片上每英寸的磁道数
-
扇区
- 每个磁道被分成更小的单位,叫做扇区
- 扇区是磁盘中可以单独寻址的最小存储单元
- 通常情况下,一个扇区可以保存512Bytes数据,但有一些磁盘可以被格式化为更大的扇区大小,如4KB扇区
-
柱面
- 在同一个磁盘中所有盘片,具有相同编号的磁道形成一个圆柱,称之为磁盘的柱面
- 柱面数 = 一个盘面上的磁道数
- 磁盘中,磁头的位置由柱面号来说明,而非磁道号
-
C/H/S(Cylinder/Head/Sector)
- 寻址模式,柱面 - 磁头 - 扇区
-
- 硬盘主要参数
- 硬盘容量(Volume)
- 容量单位为兆字节MB或千兆字节GB
- 影响硬盘容量的因素有单碟容量和碟片数量
- 转速(Rotational speed)
- 硬盘盘片每分钟转过的圈数
- 单位 RPM(Rotation Per Minute)
- 缓存(Cache)
- CPU与硬盘之间存在巨大的速度差异,为了解决硬盘在读写数据时CPU的等待问题,在硬盘上设置适当的高速缓存,用以解决两者速度不匹配的问题
- 硬盘缓存与CPU上的告诉缓存一样,是为了提高硬盘的读写速度
- 硬盘容量(Volume)
-
平均访问时间 --- 衡量硬盘性能的指标
- 平均访问时间由以下两项构成
- 平均寻道时间(Average Seek Time)
- 平均等待时间(Average Latency Time)
- 平均访问时间 = 平均寻道时间 + 平均等待时间
平均寻道时间:磁头从初始位置移动到盘面指定磁道所需的时间
硬盘等待时间:磁头已处于要访问的磁道,等待所要访问的扇区旋转至磁头下方的时间
平均等待时间通常为盘片旋转一周所需时间的一半,因此磁盘转速越快,等待的时间就越短
- 平均访问时间由以下两项构成
硬盘常用接口
接口 | 优点 | 缺点 |
---|---|---|
ATA(Advanced Technology Attachment)高级技术附加装置 | 便宜、兼容性好 | 慢、只能内置使用 |
SATA(Serial ATA)串行ATA | 点对点连接,支持热插拔、即插即用 | 中规中矩 |
SCSI(Small Computer System Interface)小型计算机系统接口 | 性能高、具有内置外置两种,支持热插拔 | 贵、难装 |
M.2(NVMe协议走PCI-E通道) | 超级快 | 巨贵 |
热插拔
-
优点
- 允许用户在不关闭系统、不切断电源的情况下取出和更换损坏的硬盘、电源或板卡等部件
- 提高了系统对灾难的及时恢复能力、扩展性和灵活性等
热插拔也可以叫热替换、热添加和热升级
固态硬盘概述
-
SSD性能优势
- 响应时间短
- SSD内部没有机械运动部件,省区了寻道时间和机械延迟
- 读写效率高
- 机械硬盘进行随机读写的时候,由于磁头不停移动,导致读写效率底下
- SSD通过内部控制器计算数据存放位置,省区机械操作时间,提高IOPS
- 4K随机读写情况下SSD硬盘性能远胜于FC硬盘
- 响应时间短
-
SSD原理
- 使用闪存技术存储信息
- 内部没有机械结构,因此耗电量小、散热小、噪音小
类型 | 容量 | 可擦写次数 | 单位容量价格 |
---|---|---|---|
SLC | 小 | 约100,000 | 高 |
eMLC 企业 | 中等 | 约30,000 | 中等 |
cMLC 消费者 | 中等 | 5,000 ~10,000 | 低 |
TLC | 大 | 500 ~ 1,000 | 很低 |
(对SSD盘可靠性影响最大的是其抗磨损能力,即Cell的可擦写次数。)
- SSD的3种主要类型
- SLC (Single Level Cell),单层式存储单元
- 一个存储单元(Cell)中只存1bit数据:0或1
- MLC (Multi Level Cell),多层式存储单元
- 一个存储单元(Cell)中只存2bit数据:00,01,10,11
- TLC (Triple Level Cell),三层式存储单元
- 一个存储单元(Cell)中只存3bit数据:000,001,010,011,100,101,110,111
- SLC (Single Level Cell),单层式存储单元
集中式存储和分布式存储
类型 | 部署模式 | 优点 | 缺点 |
---|---|---|---|
集中式存储 | 一台或多台计算机组成中心节点,数据几种存储于中心节点,并且所有业务单元都几种部署在这个中心节点中,终端只负责录入和输出 | 部署简单、底层主机性能卓越 | 缺乏异地容灾能力 |
分布式存储 | 组件分布在网络计算机上,组件之间仅仅通过消息传递来通信并协调行动 | 分布式、并发性 | 缺乏全局时钟、存在单点故障、单机能力存在瓶颈 |