linux多路径配置

一、什么是多路径
普通的电脑主机都是一个硬盘挂接到一个总线上,这里是一对一的关系。而到了有光纤组成的SAN环境,或者由iSCSI组成的IPSAN环境,由于主机和存储通过了光纤交换机或者多块网卡及IP来连接,这样的话,就构成了多对多的关系。也就是说,主机到存储可以有多条路径可以选择。主机到存储之间的IO由多条路径可以选择。每个主机到所对应的存储可以经过几条不同的路径,如果是同时使用的话,I/O流量如何分配?其中一条路径坏掉了,如何处理?还有在操作系统的角度来看,每条路径,操作系统会认为是一个实际存在的物理盘,但实际上只是通向同一个物理盘的不同路径而已,这样是在使用的时候,就给用户带来了困惑。多路径软件就是为了解决上面的问题应运而生的。
多路径的主要功能就是和存储设备一起配合实现如下功能: 
1.故障的切换和恢复 
2.IO流量的负载均衡 
3.磁盘的虚拟化 
由于多路径软件是需要和存储在一起配合使用的,不同的厂商基于不同的操作系统,都提供了不同的版本。并且有的厂商,软件和硬件也不是一起卖的,如果要使用多路径软件的话,可能还需要向厂商购买license才行。比如EMC公司基于linux下的多路径软件,就需要单独的购买license。好在, RedHat和Suse的2.6的内核中都自带了免费的多路径软件包,并且可以免费使用,同时也是一个比较通用的包,可以支持大多数存储厂商的设备,即使是一些不是出名的厂商,通过对配置文件进行稍作修改,也是可以支持并运行的很好的。
 
 
二、Linux下multipath介绍,需要以下工具包:
在CentOS 5中,最小安装系统时multipath已经被安装,查看multipath是否安装如下:
#rpm -aq|grep mapper
1、device-mapper-multipath:即multipath-tools。主要提供multipathd和multipath等工具和 multipath.conf等配置文件。这些工具通过device mapper的ioctr的接口创建和配置multipath设备(调用device-mapper的用户空间库。创建的多路径设备会在/dev /mapper中)。
2、 device-mapper:主要包括两大部分:内核部分和用户部分。内核部分主要由device mapper核心(dm.ko)和一些target driver(md-multipath.ko)。核心完成设备的映射,而target根据映射关系和自身特点具体处理从mappered device 下来的i/o。同时,在核心部分,提供了一个接口,用户通过ioctr可和内核部分通信,以指导内核驱动的行为,比如如何创建mappered device,这些divece的属性等。linux device mapper的用户空间部分主要包括device-mapper这个包。其中包括dmsetup工具和一些帮助创建和配置mappered device的库。这些库主要抽象,封装了与ioctr通信的接口,以便方便创建和配置mappered device。multipath-tool的程序中就需要调用这些库。 
3、dm-multipath.ko和dm.ko:dm.ko是device mapper驱动。它是实现multipath的基础。dm-multipath其实是dm的一个target驱动。 
4、scsi_id: 包含在udev程序包中,可以在multipath.conf中配置该程序来获取scsi设备的序号。通过序号,便可以判断多个路径对应了同一设备。这个是多路径实现的关键。scsi_id是通过sg驱动,向设备发送EVPD page80或page83 的inquery命令来查询scsi设备的标识。但一些设备并不支持EVPD 的inquery命令,所以他们无法被用来生成multipath设备。但可以改写scsi_id,为不能提供scsi设备标识的设备虚拟一个标识符,并输出到标准输出。multipath程序在创建multipath设备时,会调用scsi_id,从其标准输出中获得该设备的scsi id。在改写时,需要修改scsi_id程序的返回值为0。因为在multipath程序中,会检查该直来确定scsi id是否已经成功得到。 
  /sbin/scsi_id -g -u -s /block/sda   返回scsi的WWID
三、multipath在CentOS 5中的基本配置过程: 
1、安装和加载多路径软件包 
# yum –y install device-mapper device-mapper-multipath
# chkconfig –level 2345 multipathd on #设置成开机自启动multipathd
# lsmod |grep dm_multipath               #来检查安装是否正常
linux多路径配置 
如果模块没有加载成功请使用下列命初始化DM,或重启系统 
---Use the following commands to initialize and start DM for the first time: 
# modprobe dm-multipath 
# modprobe dm-round-robin 
# service multipathd start 
# multipath –v2
2、配置multipath:
Multipath的配置文件是/etc/multipath.conf , 如需要multipath正常工作只需要如下配置即可:
# vi /etc/multipath.conf
linux多路径配置 
3、multipath基本操作命令 
# /etc/init.d/multipathd start #开启mulitipath服务 
# multipath -F   #删除现有路径 
# multipath -v2 #格式化路径 
# multipath -ll   #查看多路径以及映射关系
linux多路径配置
如果配置正确的话就会在/dev/mapper/目录下多出data等之类设备。
linux多路径配置
用fdisk -l命令可以看到多路径软件创建的磁盘,如下图中的/dev/dm-3
linux多路径配置 
4、multipath磁盘的基本操作 
要对多路径软件生成的磁盘进行操作直接操作/dev/mapper/目录下的磁盘就行.
在对多路径软件生成的磁盘进行分区之前最好运行一下pvcreate命令。
传统的MBR方式存储使很多分区工具不能正常读取大于2TB的磁盘而无法分区大于2TB的磁盘,linux提供parted工具可以很好的支持大磁盘分区
# pvcreate /dev/mapper/mpath0
# fdisk /dev/mapper/mpath0
用fdisk对多路径软件生成的磁盘进行分区保存时会有一个报错,此报错不用理会。
fdisk对多路径软件生成的磁盘进行分区之后,所生成的磁盘分区并没有马上添加到/dev/目录下,此时我们要重启IPSAN或者FCSAN的驱动,如果是用iscsi-initiator来连接IPSAN的重启ISCSI服务就可以发现所生成的磁盘分区了
# service iscsi restart
# ls -l /dev/mapper/
linux多路径配置
如上图中的datap1-5就是我们对multipath磁盘进行的分区
# mkfs.ext3 /dev/mapper/datap1       #对datap1分区格式化成ext3文件系统
# mount /dev/mapper/datap1 /arch #挂载datap1分区
 
检查分区结果:
parted  /dev/mapper/data print
cat  /proc/partitions
 
 
四、multipath的高有配置
以上都是用multipath的默认配置来完成multipath的配置,比如映射设备的名称,multipath负载均衡的方法都是默认设置。那有没有按照我们自己定义的方法来配置multipath呢,当可以。
1、multipath.conf文件的配置
接下来的工作就是要编辑/etc/multipath.conf的配置文件
multipath.conf主要包括blacklist、multipaths、devices三部份的配置
blacklist配置
blacklist {
    devnode "^sda"
}
Multipaths部分配置multipaths和devices两部份的配置。
multipaths {
    multipath {
        wwid            ****************         #此值multipath -v3可以看到
        alias             iscsi-dm0                        #映射后的别名,可以随便取
        path_grouping_policy   multibus           #路径组策略
        path_checker       tur                           #决定路径状态的方法
        path_selector       "round-robin 0"         #选择那条路径进行下一个IO操作的方法
        }
......
Devices部分配置
devices {
    device {
        vendor           "iSCSI-Enterprise"        #厂商名称
        product          "Virtual disk"               #产品型号
        path_grouping_policy   multibus          #默认的路径组策略
        getuid_callout        "/sbin/scsi_id -g -u -s /block/%n" #获得唯一设备号使用的默认程序
        prio_callout               "/sbin/acs_prio_alua %d"         #获取有限级数值使用的默认程序
        path_checker       readsector0            #决定路径状态的方法
        path_selector         "round-robin 0"                       #选择那条路径进行下一个IO操作的方法
        failback                immediate             #故障恢复的模式
        no_path_retry            queue                 #在disable queue之前系统尝试使用失效路径的次数的数值
        rr_min_io               100                #在当前的用户组中,在切换到另外一条路径之前的IO请求的数目
        }
}
如下是一个完整的配置文件
blacklist {
devnode "^sda"
}
defaults {
user_friendly_names no
}
multipaths {
multipath {
wwid 14945540000000000a67854c6270b4359c66c272e2f356321
alias iscsi-dm0
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
multipath {
wwid 14945540000000000dcca2eda91d70b81edbcfce2357f99ee
alias iscsi-dm1
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
multipath {
wwid 1494554000000000020f763489c165561101813333957ed96
alias iscsi-dm2
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
multipath {
wwid 14945540000000000919ca813020a195422ba3663e1f03cc3
alias iscsi-dm3
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
}
devices {
device {
vendor "iSCSI-Enterprise"
product "Virtual disk"
path_grouping_policy multibus
getuid_callout "/sbin/scsi_id -g -u -s /block/%n"
path_checker readsector0
path_selector "round-robin 0"
}
}
 
获取wwid的方法:
(1)默认情况下,将使用 /var/lib/multipath/bindings 内的配置设定具体每个多路径设备名,如果在/etc/multipath.conf中有设定各wwid 别名,别名会覆盖此设定。
 
(2)# multipath -v3命令查找
 
磁盘scsi_id 获取命令 :   /sbin/scsi_id -g -u -s /block/sd*
 
 

测试步骤 
1.部署测试环境,主机上两块Emulex光线卡连接到光纤交换机,通过光纤交换机再连接到EMC CX存储,形成SAN拓扑结构。并划分1个100G的LUN分配给主机。  
9 5.8        SUSE9 9  SP1  5.9.2 9  SP3  5.9.4 9  SP4  6.1     
2.主机安装操作系统(测试前准备),安装最新版的device-mapper-multipath软件包。 通过device-mapper-multipath用户工具来验证多路径的负载均衡及路径失效切换功能: 使用fdisk命令能看到系统识别出来的4个磁盘设备,这是多条路径得到的设备名,实际上指向存储上的同一个LUN,这说明红旗操作系统已经正确识别到了EMC CX存储划分出来的LUN,并为下一步多路径管理作准备。命令及输出如下:

#fdisk -l 
Disk /dev/sdf: 103 GB, 107374182400 bytes 64 heads, 32 sectors/track, 102400 cylinders 
Units = cylinders of 2048 0* 512 = 107374182400 bytes  
Disk /dev/sdf doesn't contain a valid partition table  
Disk /dev/sdh: 103 GB, 107374182400 bytes  
64 heads, 32 sectors/track, 102400 cylinders 
Units = cylinders of 2048 0* 512 = 107374182400 bytes  
Disk /dev/sdh doesn't contain a valid partition table  
Disk /dev/sdj: 103 GB, 107374182400 bytes 64 heads, 32 sectors/track, 102400 cylinders 
Units = cylinders of 2048 0* 512 = 107374182400 bytes  
Disk /dev/sdj doesn't contain a valid partition table  
Disk /dev/sdl: 103 GB, 107374182400 bytes 64 heads, 32 sectors/track, 102400 cylinders 
Units = cylinders of 2048 0* 512 = 107374182400 bytes  
Disk /dev/sdl doesn't contain a valid partition table  
实际上这4个设备对应的是一个LUN,只是通过不同的路径看到的。

3.启动多路径管理软件 
# modprobe dm-multipath (加载dm-multipath内核模块)  
说明:系统启动时缺省地不加载这个模块。如果应用部署需要,可以在系统启动时定制。 # /etc/init.d/multipathd start (启动multipath daemon服务) # multipath –v3 (装配多路径设备) 
# multipath -ll (显示当前多路径拓扑结构) 3600601604b991100f4e5b5c83ef5da11 
[size=100 GB][features="1 queue_if_no_path"][hwhandler="1 emc"]

\_ round-robin 0 [active] 
   \_ 1:0:2:1 sdf  8:80    [ready ][active]

\_ 2:0:1:1 sdl  8:176   [ready ][active]

\_ round-robin 0 [enabled]

\_ 1:0:3:1 sdh  8:112   [ready ][active]

\_2:0:0:1 sdj  8:144   [ready ][active]  
这里的设备被分成了两组,实际上就是通过两个控制器看到的设备,其中一组的状态为[active],表示这是当前的活动控制器。接下来的对设备的读写都会通过该控制器下的/dev/sdf和/dev/sdl来进行操作。而只有当[active]控制器发生了故障或者执行了Tresspass后才会启用目前处于[enabled]状态的控制器下面的设备/dev/sdh,/dev/sdj。

上一篇:Linux下multipath多路径配置


下一篇:Linux下多路径multipath配置【转】