【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

      IBM硬件管理控制台(Hardware Management Console)提供了标准的用户接口来配置和管理Power System系列服务器以及服务器上的分区。系统管理员通过HMC对Power System服务器上的分区进行配置和日常管理。  

HMC的功能包 括:  .

创建分区,

维护分区  .

显示每个分区上虚拟的操作系统会话终端  

.显示每个分区的虚拟操作面板  

.监控,记录以及汇报硬件的更换  

.服务器开/关机  

.作为Service Focal Point设备提供远程管理和Service Agent Call-Home功能  .

激活服务器上的CUoD部件   

当前的POWER6服务器中,Power 560/570/575/595必须依靠HMC管理

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

          LPAR 既逻辑分区,指的是将一个物理的服务器划分成若干个虚拟的或逻辑的服务器,每个虚拟的或逻辑的服务器运行自己独立的操作系统,有自己独享的处理器、内存和 I/O 资源。动态逻辑分区 (DLPAR) 允许在不中断应用操作的情况下,增加或减少分区占用的资源。IBM 将这些灵活的技术从大型机(mainframe)平台带到了基于 POWER 4 处理器的 IBM pSeries 平台上从而极大的降低了该技术的价格和成本,到了 POWER 5 处理器,该项技术得到进一步发展,并引入了微分区技术。后面的power6、7就更完善了。
         动态逻辑分区的资源调整功能让系统管理员可以*添加、删除或在分区之间移动系统资源,例如 CPU、内存、I/O 适配器的分配,而不需要像原来修改之后重新启动分区。这样,微分区技术的引入,更使得动态逻辑分区的资源调整功能不但可以移动物理资源,还可移动、增减虚拟资源,具有广阔的应用场景。这样系统管理员就可以根据分区系统负荷和分区业务运行特点,随时将资源动态分配到需要的地方,从而大大提供资源的利用效率和灵活性。
对于服务器是否可以使用动态 LPAR,是要看安装在服务器上的软件是否支持。

 

我对lpar也是初步了解,在网上找了一个说明aix系统通过hmc去管理lpar的图:

(hmc还要管理aix服务器的asm)

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

通过hmc对lpar资源动态调整lpar分区需要注意:

1、 不需要重启

2、 如果是多个分区,资源调整,需要先对空闲lpar释放资源,然后在对繁忙的机器进行增加资源。

可以对内存,i/o,处理器,网卡等进行动态资源调整。


【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

    AIX项目中,必须要对HMC的基本功能了解,然后能够划分LPAR,这是很有用的知识和功能

 

LPAR概述

LPAR 即逻辑分区,指的是将一个物理的服务器划分成若干个虚拟的或逻辑的服务器,每个虚拟的或逻辑的服务器运行自己独立的操作系统,有自己独享的处理器、内存和I/O资源。

本项目中P750服务器(32CPU、256GB内存)就是通过LPAR技术将一台服务器分为两个LPAR,相当于两*立服务器使用。

IBM P720服务器需要配置硬件管理控制台 (HMC)才可以划分LPAR,本项目中就配置了一台HMC,通过将P750和P720服务器的HMC管理口和HMC的网口连接到一个网段,实现HMC对P750和P720服务器的控制。

每个LPAR至少需要一些资源,下面是每个LPAR的最小需求:

 

1)  每个分区至少一个处理器。

2)  至少256 MB内存。

3)  至少有一块硬盘用于安装操作系统

4)  至少一块网卡用于每个分区与HMC的连接。LPAR的管理要消耗服务器物理内存,本项目中IBM P750服务器的128GB物理内存在划分完LPAR后就少了4GB。

硬件管理控制台 (HMC)介绍

HMC 是一个专用的工作站,可以提供一个图形用户接口,用于配置和管理没有分区的服务器、做分区(LPAR )服务器。它通过专用的软件(已经预安装)管理pSeries服务器、划分LPAR。一个HMC能够控制多台pSeries 服务器。目前,一个HMC最多可以同时支持16台没有做集群的pSeries 服务器和最多64个LPAR。


1、登录hmc控制台,对750划分lpar,当然这之前,你要确保资源分配。

 

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

2、这里的期望处理器值是最终的值。

 

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

3、分配资源

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU


 
 



探索 AIX 6:WPAR 基本管理

工作负载分区(Workload Partition,以下简称为 WPAR)是 IBM AIX 6 在虚拟化方面的一项重要增强。在本系列的第二篇文章《探索 AIX 6:新特性概览(中)》一文中,我们已经对 WPAR 做了一个概要的介绍,读者应该对其有个大概的印象。在本文中,我们一起来了解使用 AIX 6 系统自带的工具(系统命令和 SMIT 菜单)对 WPAR 进行基本的管理操作,包括创建,删除,启动,停止,登录,挂起,备份和恢复等,并了解 WPAR 对系统环境的要求和安装前期应该进行的计划准备工作。  
 

您可以访问“AIX 6 资源中心”了解更多的 AIX 6 的新特性:

  • AIX 6 资源中心

与 IBM POWER 平台由硬件方式实现的逻辑分区(LPAR)功能不同,WPAR 是 AIX 6 内核在软件层面实现的虚拟化方案。WPAR 使得多个“系统环境”可以共享一个 AIX 操作系统,彼此之间由内核保证隔离。承载所有这些被隔离开的“系统环境”的 AIX 操作系统称之为全局环境,一个“系统环境”即 WPAR,它既可以包括一个完整的 AIX 环境(称之为系统 WPAR),也可以仅仅包括应用程序的进程(称之为应用 WPAR)。

要注意的是,WPAR 和 LPAR 具有各自的特点,是针对不同的用户需求而设计的,它们之间是互相补充,相辅相成的关系。一个 IBM POWER 服务器上可以同时运行有多个 LPAR 和 WPAR。下图较清晰的解释了系统平台,WPAR,LPAR 之间的关系。

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

上图为一个 system p 的系统平台,该平台被分割成多个 LPAR,每个 LPAR 上可以运行一个操作系统实例。LPAR 上可运行的系统包括 Linux,AIX 和 VIOS。在运行 AIX6 的 LPAR 中,我们又可以运行和管理一个或多个 WPAR。

计划和考虑

WPAR 是基于 OS 在软件层的实现的虚拟化解决方案。作为 POWER 平台硬件虚拟化的一个补充,其应用优势与应用范围综合来看有以下这么几点:

  1. 分配计算资源拥有更小更精确的粒度,占用资源较少,部署更简单,适合用于整合细小的 IT 应用。
  2. 保护硬件投资,WPAR 可以让基于 POWER4,POWER5 的硬件平台,支持更灵活的动态 WPAR 虚拟化解决方案。
  3. 采用 WPAR 技术就意味着需要更少的操作系统实例,减少了操作系统与软件包维护与管理。
  4. WPAR 支持跨服务器的虚拟化解决方案,通过 WPAR 技术可以轻松的将应用从一个服务器切换到另一台服务器。更灵活的利用整个服务群集的资源。(LPAR 在 POWER6 平台上也支持跨服务器虚拟化技术)
  5. 高可用与灾难恢复功能,WPAR 提供的 Checkpoint 功能,可以将正在运行的程序保存成系统快照镜像文件,用户可以随时从镜像的时间点继续运行程序。这种功能特别适合于高性能计算等运行时间较长的应用程序。与 HACMP 高可用机制略有不同,WPAR 提供的是镜像点(point-in-time)的高可用保护。

我们结合应用需要与 WPAR 的应用优势来综合考虑,到底采用底层的 LPAR 虚拟化分区技术,还是 WPAR 虚拟化分区技术。

考虑好是否采用 WPAR 技术,接下来要考虑的就是使用哪一种 WPAR 方式。WPAR 有两种类型,一是应用 WPAR,另一种是系统 WPAR。

应用 WPAR 是一种简单的 WPAR 方式,它与 AIX 全局环境共享文件系统和服务进程,可以简单的把应用 WPAR 看作是一个包含所有应用程序进程的一个容器。这个容器保证了应用程序进程与外界的隔离。

系统 WPAR 提供了一个虚拟的 AIX 系统环境,它有自己的初始化进程,譬如独立的 inetd 后台服务监控进程。它还有独立的用户、组权限管理、独立的网络地址,以及支持远程登录的功能。除了部分文件系统与 AIX 系统共享以外,系统 WPAR 也有独立的文件系统空间,我们可以认为系统 WPAR 就是一个缩减版的 AIX 系统环境。

应用 WPAR 与系统 WPAR 各自的特点我们用下表来为大家做一个参照。

系统 WPAR 应用 WPAR
为多个相互关联的应用提供的隔离环境,有独立的 AIX 服务进程。类似于传统的 AIX 环境。 为单个独立的应用服务进程提供隔离环境。
WPAR 需要被定义,并支持启动,关闭,重启等操作。WPAR 创建后,即可通过 lswpar 命令查询到 WPAR 的状态。 WPAR 状态只是临时性的,随着应用的启动而生成,随着应用的关闭而消失。被关闭的应用 WPAR 无法使用 lswpar 命令列出。
具有自己独立的文件系统资源,独立的初始化进程,独立的用户管理与权限控制。独立的 IP 地址,并支持远程登录。 与 AIX 全局环境共享资源

回页首

创建和删除 WPAR

系统 WPAR 的创建。

创建一个最简单的系统 WPAR,只需要使用命令“mkwpar –n ”即可。WPAR 的创建也支持使用 smit 命令(smit mkwpar)。

我们接下来将使用 mkwpar 命令创建一个系统 WPAR,名称为 mywpar01,使用 -N 指定 ip 地址为 192.168.21.136. ip 绑定在网卡 en0 上,为了能够独立的安装软件,我们使用 -M 参数指定使用了独立的文件系统,还使用 -A 参数指定系统启动时 WPAR 分区自动启动。完整的命令如下:

mkwpar -N interface=en0 address=192.168.21.136 netmask=255.255.0.0 -A -M directory=/ 
vfs=jfs2 size=5G -M vfs=directory directory=/var -M vfs=directory directory=/tmp -M 
vfs=directory directory=/home -M vfs=directory directory=/usr -M vfs=directory 
directory=/opt -n mywpar01

mkwpar: Creating file systems...
 /
 /home
 /opt
 /proc
 /tmp
 /usr
 /var
Mounting all workload partition file systems.
x ./usr
x ./lib
x ./admin
x ./admin/tmp
.
.( 省略若干行 )
Workload partition mywpar01 created successfully.
mkwpar: 0960-390 To start the workload partition, execute the following as root:
 startwpar [-v] mywpar01

 

我们可以使用 lswpar 来检查我们所常见的 WPAR 状态。

# lswpar
Name State Type Hostname Directory 
-------------------------------------------------
mywpar01 D S mywpar01 /wpars/mywpar01

 

我们看到我们已经创建好了 mywpar01,其状态为 D(defined 定义好的),类型为 S(System 系统 WPAR)。

应用 WPAR 的创建。

应用 WPAR 的创建较为简单,只须使用 wparexec 命令来执行应用程序即可。请注意应用程序需使用绝对路径调用。例如我们使用应用 WPAR 来执行 vmstat 程序

# wparexec /usr/bin/vmstat 5//5 为 vmstat 的参数 
Starting workload partition 'vmstat'.
Mounting all workload partition file systems.
Loading workload partition.

vmstat configuration: @lcpu=4 @mem=1024MB @ent=0.30 

kthr memory page faults cpu 
----- ----------- ------------------------ ------------ -----------------------
 @ @ @ @ @ 
 r b avm fre re pi po fr sr cy in sy cs us sy id wa pc ec
 0 0 140685 73170 0 0 0 0 0 0 18 1262 1 2 98 - - 0.00 0.4
 0 0 140686 73169 0 0 0 0 0 0 7 9 1 1 99 - - 0.00 0.5

 

我们此时再执行 lswpar,就可以看到现在多了一个应用 WPAR,它的名称是 vmstat,状态是 A(活动的)。wparexec 除了可以用来启动一个可执行程序外,也可用来启动一个脚本从而在 WPAR 中运行多个程序。

# lswpar
Name State Type Hostname Directory
-------------------------------------------------
mywpar01 D S mywpar01 /wpars/mywpar01
vmstat A A vmstat /

 

WPAR 的删除

应用 WPAR 中所有进程退出后,WPAR 即自动删除了,无需手动操作,系统 WPAR 的删除可参照下列步骤:

  • 确认系统 WPAR 处于 Defined 状态。只有 Defined 状态下的 WPAR 才能执行正常的删除操作。
  • 确认不再需要该 WPAR。
  • 执行 rmwpar < WPAR name> 删除 WPAR,如 rmwpar mywpar01。

对于损坏的 WPAR,可以使用 rmwpar –F 强行删除 WPAR。

回页首

启动和停止 WPAR

系统 WPAR 支持启动,关闭,重启等操作,启动 mywpar01:

# startwpar mywpar01
Starting workload partition 'mywpar01'.
Mounting all workload partition file systems.
Loading workload partition.
Exporting workload partition devices.
Starting workload partition subsystem 'cor_mywpar01'.
0513-059 The cor_mywpar01 Subsystem has been started. Subsystem PID is 499778.
Verifying workload partition startup.
# lswpar
Name State Type Hostname Directory 
-------------------------------------------------
mywpar01 A S mywpar01 /wpars/mywpar01

 

我们通过 lswpar 看到 mywpar01 状态已经变成 Active 了。接下来我们重启 WPAR,重启系统 WPAR 可以登录到 WPAR 中然后使用 shutdown –Fr 命令像重启操作系统一样重启 WPAR,也可以使用 rebootwpar 命令来实现。

# rebootwpar -N mywpar01// 加上 -N 参数则立即重启,否则将等待 600 秒
Stopping workload partition 'mywpar01'.
Stopping workload partition subsystem 'cor_mywpar01'.
0513-006 The Subsystem, cor_mywpar01, is currently stopping its execution.
stopwpar: 0960-242 Waiting for workload partition to halt.
Shutting down all workload partition processes.
Unmounting all workload partition file systems.
Starting workload partition 'mywpar01'.
Mounting all workload partition file systems.
Loading workload partition.
Exporting workload partition devices.
Starting workload partition subsystem 'cor_mywpar01'.
0513-059 The cor_mywpar01 Subsystem has been started. Subsystem PID is 446548.
Verifying workload partition startup.
#

 

下面我们使用命令 stopwpar 来停止 mywpar01:

# stopwpar -N mywpar01 // 加上 -N 参数立即关闭,否则将等待 600 秒。
Stopping workload partition 'mywpar01'.
Stopping workload partition subsystem 'cor_mywpar01'.
0513-006 The Subsystem, cor_mywpar01, is currently stopping its execution.
stopwpar: 0960-242 Waiting for workload partition to halt.
Shutting down all workload partition processes.
Unmounting all workload partition file systems.

 

回页首

登录和操作 WPAR

登录到系统 WPAR 可以有 2 种方式,一是在 AIX 全局环境下使用 clogin 命令进入 WPAR,另外则是通过 WPAR 的 IP 直接用 telnet 的方式登录。

# telnet 192.168.21.136// 使用 telnet 方式
Trying...
Connected to 192.168.21.136.

AIX Version 6
Copyright IBM Corporation, 1982, 2007.
login:

					// 使用 clogin 方式
# clogin mywpar01
******************************************************************************
* Welcome to AIX Version 6.1! *
* *
* Please see the README file in /usr/lpp/bos for information pertinent to *
* this release of the AIX Operating System. *
*******************************************************************************
Last login: Thu Feb 28 17:36:26 2008 on /dev/pts/0 from 10.172.192.6
# hostname
mywpar01

 

系统 WPAR 的操作命令风格与 AIX 环境一样,接下来您就可以在 WPAR 安装运行程序了

回页首

安装应用软件

在默认的情况下,系统 WPAR 与 AIX 全局环境共享 /usr 和 /opt 目录,并只有只读的权限,WPAR 用户无法写入,所以安装软件必须在 AIX 全局环境下进行。如果你一定要在 WPAR 中独立安装软件,则必须在创建系统 WPAR 时使用参数 -M 声明使用独立的 /usr 和 /opt 文件系统分区,具体参数使用方法可参考上文中创建删除 WPAR 部分。我们之前创建的系统 WPAR 有独立的 /usr 和 /opt 分区,所以接下来可直接演示在系统 WPAR 中安装一个 apache Web 应用。Apache 是一个 rpm 的安装包,我们将使用 rpm 命令来安装,AIX 其他的安装软件的方式如 smit、installp 也都能正常在系统 WPAR 环境下使用。

# df// 请注意 opt 与 /usr 是根分区下的一个目录,有读写权限。
Filesystem 512-blocks Free %Used Iused %Iused Mounted on
/dev/fslv12 10485760 5983800 43% 42637 6% /
/proc - - - - - /proc
# rpm -ivh expat-1.95*
expat ##################################################
# rpm -ivh apache-1.3.31-1.aix5.1.ppc.rpm
apache ##################################################
#cd /opt/freeware/apache/share/htdocs// 进入 apache 放置网页的目录
#echo "this is a test page for WPAR http service" > index.html
   // 生成一个简单的页面,打开后显示“this is a test page for WPAR http service”。 
# /opt/freeware/apache/sbin/apachectl start// 启动 http 服务
/opt/freeware/apache/sbin/apachectl start: httpd started

 

启动 http 服务后,我们可以通过系统 WPAR 的 IP 地址访问其 WEB 服务,我们用 IE 浏览器来验证。请注意我们刚才创建 WPAR 时指定的 IP 地址为 192.168.21.136,我们可以通过 http://192.168.21.136 来访问我们刚才生成的一个页面。

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

至此,我们已经演示了一个基本的 WPAR 的创建,管理与应用整个全过程。

回页首

暂停和恢复 WPAR

挂起和恢复 WPAR 是在服务器间动态移动 WPAR 的基础,挂起 WPAR 也即将当前时刻的 WPAR 运行状态使用快照的方式保存下来,恢复过程则是从快照文件读取 WPAR 状态信息,继续运行 WPAR。这是 WPAR 的高级功能之一,需要安装 WPAR agent,这部分内容将在续篇中详细说明。

回页首

备份和还原 WPAR

备份 wpar 非常简便,我们不但可以备份 Defined 状态的系统 WPAR,也可以备份活动的 WPAR。备份 WPAR 使用 savewpar 命令,使用 -f 指定备份设备或备份的文件位置。

# savewpar -f /tmp/mywpar01.bak mywpar01 // 备份完全独立分区的 WPAR 需要较大的空间

Creating information file (/image.data) for mywpar01.

Creating list of files to back up ..
Backing up 43993 files.................
43993 of 43993 files backed up (100%)
0512-038 savewpar: Backup Completed Successfully.
					
# savewpar -f /tmp/wpar.bak mychkwpar// 备份与全局环境共享 /usr,/opt 目录的分区只需要极少的空间

Creating list of files to back up 
Backing up 7 files
7 of 7 files backed up (100%)
0512-038 savewpar: Backup Completed Successfully.

 

在还原 WPAR 过程中,如果原 WPAR 仍然存在,则需要加 -F 参数关闭并删除原 WPAR,然后按照备份的 WPAR 重新创建 WPAR 并还原。如原 WPAR 已被删除,则还原过程相当于按照备份文件重建 WPAR。

# restwpar -F -f /tmp/wpar.bak
New volume on /tmp/wpar.bak:
 Cluster 51200 bytes (100 blocks).
 Volume number 1
 Date of backup: Wed Mar 5 21:43:12 2008
 Files backed up by name
 User root
x 2848 ./.savewpar_dir/wpar.spec
x 399 ./.savewpar_dir/image.data
x 125796 ./.savewpar_dir/backup.data
 total size: 129043
 files restored: 3
Stopping workload partition 'mychkwpar'.
Stopping workload partition subsystem 'cor_mychkwpar'.
0513-044 The cor_mychkwpar Subsystem was requested to stop.
Shutting down all workload partition processes.
Unmounting all workload partition file systems.
rmwpar: Removing file system /wpars/mychkwpar/var.
rmwpar: Removing file system /wpars/mychkwpar/usr.
rmwpar: Removing file system /wpars/mychkwpar/tmp.
rmwpar: Removing file system /wpars/mychkwpar/proc.
rmwpar: Removing file system /wpars/mychkwpar/opt.
rmwpar: Removing file system /wpars/mychkwpar/home.
rmwpar: Removing file system /wpars/mychkwpar.
mkwpar: Creating file systems...
 /
 /home
….( 省略若干 )
syncroot: Processing root part installation status.
syncroot: ATTENTION, Root part is currently synchronized, but there are other
Workload partition mychkwpar created successfully.
mkwpar: 0960-390 To start the workload partition, execute the following as root: \
 startwpar [-v] mychkwpar

 

克隆 WPAR,我们很快发现可以利用还原 WPAR 的功能快速的复制 WPAR。还可以将备份文件拷贝到其他的服务器上,实现快速的应用部署。要注意的是我们在克隆 WPAR 的时候需要定义新的主机和 IP 地址。

restwpar -n myclonewpar -h myclonewpar -r -M "-N address=192.168.21.131" 
-d /wpars/myclonewpar -U -f /tmp/wpar.bak
//Restwpar 的基本参数:-n 定义新 WPAR 名,-h 定义新 WPAR 主机名,-r 复制域名解析相关文件,
-M 为 mkwpar 传递参数,-d 指定 wpar 创建位置,-f 指定还原设备或文件。
New volume on /tmp/wpar.bak:
 Cluster 51200 bytes (100 blocks).
 Volume number 1
 Date of backup: Wed Mar 5 21:43:12 2008
 Files backed up by name
 User root
x 2848 ./.savewpar_dir/wpar.spec
x 399 ./.savewpar_dir/image.data
x 125796 ./.savewpar_dir/backup.data
 total size: 129043
files restored: 3
。。。(省略若干)
Workload partition myclonewpar created successfully.

 

回页首

WPAR 的状态

在文章最后向大家介绍一下 WPAR 的多种状态,系统管理员在使用 lswpar 命令时可以查看到 WPAR 的状态信息。下表给出了各种状态的说明。

状态 标志 说明
Defined D 规格参数已定义,但是处于停止、未启动的状态。
Active A WPAR 已启动激活,正在正常运行的状态
Paused P 完成一次 checkpointing,WPAR 已经被保存下来后的一种等待状态,等待用户发出继续或者停止运行命令。
Broken B WPAR 出现故障,无法正常工作并且恢复操作也失败。
Transitional T 当前 WPAR 正在从一个状态切换到另一个的一种临时状态
Frozen F 主要见于 HPC 或分布式应用中,WPAR 被冻结,管理员可以检查是否正确的执行了 checkpointing,但是又不用真正去执行暂停操作进入到 Paused 状态。
Loaded L 对于支持动态迁移的 WPAR,当其完全移动到在目标系统上又还未启动进入 Active 状态前的状态。


 




 

浅解逻辑分区LPAR与DLPAR(原创)

博客分类:  AIX

 

作为一个DBA,对操作系统及底层硬件的了解也许不是那么至关重要,但是越好的了解数据库所运行的环境就能越好的了解数据库。这里笔者简单介绍下LPAR与DLPAR

为什么服务器需要分区 
近来,UNIX服务器的分区技术成为一个热点。分区技术在某些应用领域的确能带来实际的好处,但也不能一概而论。这些年分区技术的作用有被逐渐夸大的趋势,在有些时候还被描述成无所不能的技术,目前主流的分区技术可以分为物理分区、逻辑分区和动态逻辑分区。
分区的优点
服务器集中
服务器的集中管理和应用模式的集中可以减少总拥有成本(TCO)。这是目前的一个趋势。这种集中式的应用模式加上服务器的分区管理为客户提供了一种更好的使用服务器的方式,同时可降低系统管理方面开销。
隔离生产环境和测试环境
在一台物理的机器上,一个分区作为生产环境;另一个分区作为测试环境。它们有各自独立的系统环境,互不干扰。这是一个很诱人的工作模式。
提高硬件的使用率
当一个较大的应用实例不能充分发挥整个机器的硬件能力时,可考虑将其划分成若干个较小的应用实例,运行在机器不同的逻辑分区上,以提高整体的生产能力。
隔离不同的应用环境
如果应用程序需要不同的系统环境(例如时钟)时,可将其运行在不同的逻辑分区上。
提高硬件资源分配的灵活性
在业务高峰时,为该应用分配更多的系统资源(如CPU、内存等)。这通过调整不同
逻辑分区  之间的硬件资源来实现。

物理分区

物理分区简称为PPAR,是一种将一台SMP服务器分为多个处理单元的技术。这些处理单元可以被看作一台台小服务器。之所以称为PPAR,是因为这些处理单元必须按服务器体系结构所限定的边界来划分(如下图),所以这种分区方式有两个缺点,其一是分区缺乏灵活性,系统无法按照应用的具体要求进行划分;其二是由于这种体系结构的限制,当分区较大时,系统的性能不好。

【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

逻辑分区

LPAR 即逻辑分区指的是将一个物理的服务器划分成若干个虚拟的或逻辑的服务器,每个虚拟的或逻辑的服务器运行自己独立的操作系统,有自己独享的处理器、内存和 I/O资源。动态逻辑分区允许在不中断应用操作的情况下,增加或减少分区占用的资源。IBM将这些灵活的技术从大型机(mainframe) 平台带到了基于POWER4处理器的IBM pSeries平台上从而极大的降低了该技术的价格和成本。

简单说,逻辑分区(LPAR)就是将单台服务器划分成多个逻辑服务器,彼此运行独立的应用程序。逻辑分区不同于物理分区(PhysicalPartitioningPPAR),物理分区是将物理的将资源组合形成分区,而逻辑分区则不需要考虑物理资源的界限。相对而言,逻辑分区具有更多的灵活性,可以在物理资源中*的选择部件,这需要有比较好的保证,即最大化的使用系统资源,但又最小化不必要的资源再分配。在逻辑分区的环境下,如CPU、内存和I/O都可以独立的分配给每个分区。逻辑分区的配置和管理是通过硬件管理控制台(Hardware Management Console)实现的。

动态逻辑分区 
在单台服务器上管理、协调工作量,逻辑分区给我们提供许多灵活性,因为我们可以将单台服务器划分成多台逻辑服务器,而且每台逻辑服务器都具有自己的资源,然而,逻辑分区也有些限制,如要增加或删除资源,必须停止逻辑分区的运行,然后重新引导分区。
动态逻辑分区,则消除了以上的局限,例如,AIX 5.2具有动态增加、删除资源的能力,可以动态的增加、删除CPU、内存和适配卡,而不用重新启动机器。动态逻辑分区,具有逻辑分区的所有优点,又增加了动态改变系统资源使用的能力。
动态逻辑分区的优点
在动态逻辑分区的环境下,给我们提供了更大的灵活性,硬件资源可以按需分配,
以下详细列举动态逻辑分区的优点:
RAS(reliability, availability, serviceability )性能进一步得到提高。有故障的CPU可以动态删除,另外动态逻辑分区组合CUoD是CPU可动态备份,故障的CPU可以
被后备的CPU透明的替换。
升级PCI系统主板(带热插拔功能),升级可不需重新启动而又不影响其他的分区
转移系统资源到最需要的分区中。例如,应用程序如耗尽CPU资源,另外的CPU可以动态的分配到此分区
通过CUoD功能可动态的激活并使用资源,这些后备的资源,可以在系统管理员认为机器需要更多的处理能力时激活使用,而这些后备资源可以在客户确定要激活时才付费。
安装新的操作系统,以供测试。为了使应用可以跟踪操作系统的更新,可以创建新的分区,供测试使用。为获得足够的资源,动态逻辑分区使得从运行中的分区释放资源变得更加容易。
再分配I/O设备,如光驱、带机。这些设备可以很快又容易的从一个分区再分配到另一个分区以供安装、备份等用。
在系统运行的高峰时刻,可以在分区之间移动CPU,内存,高峰过后则可将这些资源重新转移回去。
维护一个空闲的资源池(CPU、内存和I/O),因而新创建的分区可以比较简单的从空闲池中获取资源。

逻辑分区和动态逻辑分区软硬件支持表 
IBM pSeries 支持分区的服务器的机型        LPAR        动态LPAR        最大分区的个数
pSeries 630 6c1        支持        支持        4
pSeries 630 6E1        支持        支持        3
pSeries 650        支持        支持        8
pSeries 655        支持        支持        4
pSeries 670        支持        支持        16
pSeries 690        支持        支持        32


上面的服务器需要配置硬件管理控制台 (HMC) 才可以支持逻辑分区和动态逻辑分区。 
对于上面的服务器是否可以使用动态LPAR,还要看安装在服务器上的软件: 可以使用动态 LPAR : 在动态 LPAR 可用状态下,调整资源的分配可以不需要停止或重新启动相关的分区。如果希望实现动态LPAR需要在相关的分区安装 AIX 5L 5.2 版本,并且HMC recovery 软件必须至少是3.1 版本(或更高)。 如果分区运行的是 AIX 5L 5.1 版本或Linux操作系统,则不可以使用动态逻辑分区。
不可以使用动态 LPAR: 如果没用动态LPAR的功能, 分区的资源是静态的。动态LPAR对于运行AIX 5L 5.1 版本或Linux操作系统是不可用的。当需要改变或重新配置分区的资源时,由于没有动态LPAR,所有相关的分区必须被停止或重新启动以使得资源的改变生效,但是不会影响其它分区的操作。 (一个服务器的分区可以同时拥有可以做动态LPAR的分区和不能做动态LPAR 的分区。)
注意:Reboot一个正在运行的分区只会重新启动分区上的操作系统并不会重新启动LPAR. 如果想要重新启动LPAR,必须shut down 操作系统然后再启动操作系统,不能用reboot方式。

分区的硬件要求 

每个LPAR至少需要一些资源,下面是每个LPAR的最小需求:
每个分区至少一个处理器。
至少256 MB 内存。
至少有一块硬盘用于安装和存储操作系统(对于AIX, 做为rootvg)。
至少一块硬盘适配器或集成的适配器用于连接硬盘。
至少一块网卡用于每个分区与HMC的连接。
每个分区必须有一个安装模式, 例如NIM。


参考至:http://blog.sina.com.cn/s/blog_404f5200010006yc.html

         http://www.itpub.net/viewthread.php?tid=473989&extra=&page=1

         http://book.51cto.com/art/200911/164447.htm

         http://hi.baidu.com/xayangjing/blog/item/bcf0f6ce3eb0d631b600c8e2.html

本文原创,转载请注明出处、作者

如有错误,欢迎指正

邮箱:czmcj@163.com

 



AIX下查看系统中逻辑和物理cpu的方法

字数 3566 阅读 2151 评论 1 赞 2

作者:吴湘

系统中有很多命令可以查看cpu的个数,但是哪个命令输出的是逻辑cpu个数,哪个又是物理cpu个数呢?下面做一个简单的介绍。

从AIX5.3起,对于power5的机器,系统引入了SMT(Simultaneous multi-threading)的功能,其允许两个处理线程在同一颗处理器上运行,对操作系统而言,一颗物理处理器逻辑上会成为两个处理单元(逻辑处理器)。也就是说,在SMT功能启用的情况下,逻辑cpu个数是物理cpu个数的两倍,而在SMT功能禁用的情况下,逻辑cpu个数与物理cpu个数相等。从Power6以后,开始支持四个处理线程在同一颗处理器上运行。

在操作系统中,查看SMT是否开启,可以使用smtctl或者lsattr -El命令查看,如下所示:
【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU
【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

接下来分别对Power物理机和虚拟机如何查看CPU做一个详细的介绍:

(一)物理机中查看CPU的方法

  1. bindprocessor # bindprocessor -q The available processors are: 0 1 2 3 4 5 6 7 可以看到可用逻辑cpu个数是8个(0-7)。
  2. prtconf # prtconf System Model: IBM,9131-52A Machine Serial Number: 0677A5G Processor Type: PowerPC_POWER5 Number Of Processors: 4 ==>物理cpu有4个(如果使用的 是share模式,显示的则是虚拟cpu数量) Processor Clock Speed: 1648 MHz CPU Type: 64-bit Kernel Type: 64-bit LPAR Info: 1 06-77A5G 3.lsdev # lsdev -Cc processor proc0 Available 00-00 Processor proc2 Available 00-02 Processor proc4 Available 00-04 Processor proc6 Available 00-06 Processor 可以看到系统中有4个物理cpu。 4.vmstat # vmstat System configuration: lcpu=8 mem=7936MB kthr memory page faults cpu ----- ----------- ------------------------ ------------ ----------- r b avm fre re pi po fr sr cy in sy cs us sy id wa 1 1 428238 41599 0 0 0 13 25 0 40 1639 182 0 0 99 可以看到系统中有8个逻辑cpu。 5.lparstat 【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU 可以看到系统中有32个逻辑CPU,SMT是4.

(二)Power虚拟机中查看CPU的方法

Power虚拟化的时候采用了微分区的技术,这里需要理解下微分区概要文件的设置规则。

2.1分区概要文件 (profile) 设置规则

在创建分区的时候,选择创建Shared CPU 分区,如下图:
【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

在接下来的页面中,需要设置虚拟 CPU 和物理 CPU 的数量:
【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU
关于上图几个数值,这里需要详细说明。

在概要文件的设置中,我们既不能将虚拟处理器设置的太多,这样会造成过多的 CPU 上下文切换;也不能将其设置的过低,那样微分区将不能调度或者获取足够的物理 CPU。

物理 CPU 的“最小处理单元数(Minimum processing units)”、“期望处理单元数(Desired processing units)”、“最大处理单元数(Maximum processing units)”的含义与普通 LPAR 没有区别,分别代表“激活分区所需的最少物理 CPU 资源”、“激活分区时期望获取的物理 CPU 资源”、“分区可以获得最多物理 CPU 资源”。

就普通 LPAR 而言,一个分区激活以后,其自动获取的 CPU 资源处于大于等于“最小处理单元数”、小于等于“期望处理单元数”的闭区间内。“最大处理单元数”的设置数值,是手工对分区做 DLPAR 操作时,LPAR 可以增加到的最多 CPU 数量。

虚拟 CPU 的“最小虚拟处理器数”、“期望虚拟处理器数”、“最大虚拟处理器数”的含义分别为:“激活分区所需的最少虚拟 CPU 数量”、“激活分区时期望获取的虚拟 CPU 数量”、“分区可以获得最多虚拟 CPU 数量”。从概念的描述上看,虚拟 CPU 的数值含义似乎无太大的差别,只是多了“虚拟”两个字,实际上区别很大。实际上,虚拟 CPU 的数量我们可以设置的很大,因为这个较大数值不会给客户带来成本,而事实上,虚拟 CPU 实际上也不存在不够用的情况,除非我们将其设置得过小,而共享 CPU 池中的空闲物理 CPU 很多。

另外上图中的Uncapped值如果勾选的话,表示允许CPU超过对应的授权,当微分区的处理能力不足并且所属的Shared processor pool中有剩余的CPU资源时,微分区可以从Shared processor pool自动获取处理器资源来提升处理能力,微分区内的虚拟CPU资源可以自动超过entitled capacity的值(此值为分区启动后分区获得的CPU资源,大于最小值,小于等于期望值)。在我们实际的生产中,topas的时候经常会看到“Entc%”的值超过了100%,就是因为设置了Uncapped。如下例所示, Entc%的值达到189.50%,其entitled capacity为4C,期望虚拟处理器数设置为8C,此分区从共享池中获取了处理器资源来提升处理能力,这里达到了7.58C,因此Entc%=7.58/4=189.50%,超过了100%。
【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

如果Uncapped值未勾选,表示不允许CPU超过对应的授权,即使微分区的处理能力不够,微分区也不会自动的向Shared processor pool获取资源,微分区内的虚拟CPU资源不会自动超过entitled capacity的值。

Uncapped分区的优先级使用权重值(Weight项)来衡量,当多个Uncapped模式的微分区同时争夺Shared processor pool中的CPU资源,并且Shared processor pool中的CPU资源不足以为每个Uncapped模式的微分区分配足够的CPU资源时,Power服务器的Hypervisor通过权重值机制来调配每个分区获得的CPU资源。Weight的范围是0-255,权重值越大,获得CPU资源越多。比如在新一代Power小机中对于VIOS 配置为255,对于AS分区配置为128,对于数据库分区配置为192。

微分区的意义在于降低 CPU 的空闲率,从而降低客户的 IT 成本。因此,在这种情况下,我们通常将对等的虚拟 CPU 的数量设置的比物理 CPU 的数量要高,否则就失去了微分区意义。

Power小型机是有HMC进行管理的,分区的概要文件也是通过HMC的界面去进行配置的,但实际运维过程中,系统管理员访问HMC不是很方便,我们可以使用lparstat –i命令去查看实际的分区概要文件的配置情况,如下所示:
【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

2.2 虚拟机查看CPU的方法

和物理机查看的方法一样,可以使用bindprocessor –q、lsdev -Cc processor、vmstat等命令查看,需要注意的是prtconf查看到的Number Of Processors是对应的虚拟CPU的数量。
【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

使用lparstat命令可以查看到实际使用的物理CPU的数量,如下例中的ent的值为8,表示本台虚拟机使用的实际物理CPU是8C。
【AIX】LPar分区技术、逻辑CPU、虚拟CPU、物理CPU

其他几项重要的项描述含义如下所示:
- psize 池中在线物理处理器的数量。 
- ent 处理器单元中授权处理容量。此信息只在分区类型为共享时显示。 
- physc 显示消耗的物理处理器的数量。 
- app 显示共享池中可用的物理处理器。


上一篇:aix系统常用命令


下一篇:【AIX】AIX内存机制