Ceph集群与Ceph块存储

文章目录

Ceph集群与Ceph块存储

实验环境准备

准备四台虚拟机,其三台作为存储集群节点,一台安装为客户端,实现如下功能:

  • 创建1台客户端虚拟机
  • 创建3台存储集群虚拟机
  • 配置主机名、IP地址、YUM源
  • 修改所有主机的主机名
  • 配置无密码SSH连接
  • 配置NTP时间同步
  • 创建虚拟机磁盘

方案

使用4台虚拟机,1台客户端、3台存储集群服务器,拓扑结构如图-1所示。
Ceph集群与Ceph块存储
所有主机的主机名及对应的IP地址如表-1所示。

注意:所有主机基本系统光盘的YUM源必须提前配置好。
Ceph集群与Ceph块存储
Ceph组件架构如图-2所示。
Ceph集群与Ceph块存储
Ceph会对数据进行切割处理,如图-3所示。
Ceph集群与Ceph块存储
Ceph随机读写数据的思路,如图-4所示。
Ceph集群与Ceph块存储
Ceph集群结构如图-5所示。
Ceph集群与Ceph块存储

为所有节点配置yum源服务器。

为虚拟机添加磁盘:

除了client客户端,所有3台ceph服务器都添加2块20G磁盘。

所有主机设置防火墙和SELinux(如果已经关闭,则此步骤可以忽略)

[root@client ~]# firewall-cmd --set-default-zone=trusted
[root@client ~]# sed -i '/SELINUX/s/enforcing/permissive/' /etc/selinux/config
[root@client ~]# setenforce 0
[root@node1 ~]# firewall-cmd --set-default-zone=trusted
[root@node1 ~]# sed -i '/SELINUX/s/enforcing/permissive/' /etc/selinux/config
[root@node1 ~]# setenforce 0
[root@node2 ~]# firewall-cmd --set-default-zone=trusted
[root@node2 ~]# sed -i '/SELINUX/s/enforcing/permissive/' /etc/selinux/config
[root@node2 ~]# setenforce 0
[root@node3 ~]# firewall-cmd --set-default-zone=trusted
[root@node3 ~]# sed -i '/SELINUX/s/enforcing/permissive/' /etc/selinux/config
[root@node3 ~]# setenforce 0

配置无密码连接(包括自己远程自己也不需要密码),在node1操作。

[root@node1 ~]# ssh-keygen   -f /root/.ssh/id_rsa    -N ''
#-f后面跟密钥的文件名称(希望创建密钥到哪个文件)
#-N ''代表不给密钥配置密钥(不能给密钥配置密码)
[root@node1 ~]# for i in 10  11  12  13
 do
     ssh-copy-id  192.168.4.$i
 done
#通过ssh-copy-id将密钥传递给192.168.4.10、192.168.4.11、192.168.4.12、192.168.4.13

修改/etc/hosts并同步到所有主机。

注意:/etc/hosts解析的域名要与本机主机名一致!!!!

 [root@node1 ~]# vim /etc/hosts     #修改文件,手动添加如下内容(不要删除文件原有内容)
... ...
192.168.4.10  client
192.168.4.11     node1
192.168.4.12     node2
192.168.4.13     node3

提示:/etc/hosts解析的域名必须与本机主机名一致!!!

将/etc/hosts文件拷贝给所有其他主机(client、node1、node2、node3)

[root@node1 ~]# for i in client node1  node2  node3
do
scp  /etc/hosts   $i:/etc/
done

修改所有节点都需要配置YUM源,并同步到所有主机。

[root@node1 ~]# vim /etc/yum.repos.d/ceph.repo    #新建YUM源配置文件,内容如下
[mon]
name=mon
baseurl=ftp://192.168.4.254/ceph/MON
gpgcheck=0
[osd]
name=osd
baseurl=ftp://192.168.4.254/ceph/OSD
gpgcheck=0
[tools]
name=tools
baseurl=ftp://192.168.4.254/ceph/Tools
gpgcheck=0
[root@node1 ~]# yum clean all               #清空缓存
[root@node1 ~]# yum repolist                #验证YUM源软件数量
源标识            源名称                    状态
Dvd                redhat                    9,911
Mon                mon                        41
Osd                osd                        28
Tools            tools                    33
repolist: 10,013
[root@node1 ~]# for i in  client  node1  node2  node3
do
scp  /etc/yum.repos.d/ceph.repo   $i:/etc/yum.repos.d/
done

给所有节点安装ceph相关软件包。

[root@node1 ceph-cluster]# for i in node1 node2 node3
do
    ssh  $i "yum -y install ceph-mon ceph-osd ceph-mds ceph-radosgw"
done 

Client主机配置NTP服务器。

[root@client ~]# yum -y install chrony
[root@client ~]# vim /etc/chrony.conf
    allow 192.168.4.0/24        #大约26行
    local stratum 10            #大约29行(去注释即可)
[root@client ~]# systemctl restart chronyd

node1,node2,node3修改NTP客户端配置。

[root@node1 ~]# yum -y install chrony
[root@node1 ~]# vim /etc/chrony.conf
server 192.168.4.10   iburst              #配置文件第二行,手动添加一行新内容
[root@node1 ~]# systemctl restart chronyd
[root@node1 ~]# chronyc sources -v        #查看同步结果,应该是^*
[root@node2 ~]# yum -y install chrony
[root@node2 ~]# vim /etc/chrony.conf
server 192.168.4.10   iburst              #配置文件第二行,手动添加一行新内容
[root@node2 ~]# systemctl restart chronyd
[root@node2 ~]# chronyc sources -v            #查看同步结果,应该是^*
[root@node3 ~]# yum -y install chrony
[root@node3 ~]# vim /etc/chrony.conf
server 192.168.4.10   iburst              #配置文件第二行,手动添加一行新内容
[root@node3 ~]# systemctl restart chronyd
[root@node3 ~]# chronyc sources -v       #查看同步结果,应该是^*

部署Ceph集群

部署Ceph集群服务器,实现以下目标:

  • 安装部署工具ceph-deploy
  • 创建ceph集群
  • 准备日志磁盘分区
  • 创建OSD存储空间
  • 查看ceph状态,验证

安装部署软件ceph-deploy

在node1安装部署工具,学习工具的语法格式。

[root@node1 ~]#  yum -y install ceph-deploy
[root@node1 ~]#  ceph-deploy  --help
[root@node1 ~]#  ceph-deploy mon --help

创建目录(目录名称可以任意,推荐与案例一致)

[root@node1 ~]#  mkdir ceph-cluster
[root@node1 ~]#  cd ceph-cluster/

部署Ceph集群

创建Ceph集群配置,在ceph-cluster目录下生成Ceph配置文件(ceph.conf)。
[root@node1 ceph-cluster]# ceph-deploy new node1 node2 node3
[root@node1 ceph-cluster]# vim ceph.conf        #不要修改原始内容,在文件末尾添加一行
rbd_default_features = 1
#默认开启COW分层快照的功能

初始化所有节点的mon服务,也就是启动mon服务。

拷贝当前目录的配置文件到所有节点的/etc/ceph/目录并启动mon服务。

[root@node1 ceph-cluster]# ceph-deploy mon create-initial
#配置文件ceph.conf中有三个mon的IP,ceph-deploy脚本知道自己应该远程谁

在每个node主机查看自己的服务(注意每台主机服务名称不同)

[root@node1 ceph-cluster]# systemctl status ceph-mon@node1
[root@node2 ~]# systemctl status ceph-mon@node2
[root@node3 ~]# systemctl status ceph-mon@node3
#备注:管理员可以自己启动(start)、重启(restart)、关闭(stop),查看状态(status).
#提醒:这些服务在30分钟只能启动3次,超过就报错. 
#StartLimitInterval=30min
#StartLimitBurst=3
#在这个文件中有定义/usr/lib/systemd/system/ceph-mon@.service
#如果修改该文件,需要执行命令# systemctl  daemon-reload重新加载配置

查看ceph集群状态(现在状态应该是health HEALTH_ERR)

[root@node1 ceph-cluster]# ceph -s
【提示】:如果无法成功部署ceph集群,可以通过如下命令清理集群软件以及相关数据(注意,这些操作会删除node1-node3主机的所有ceph软件及配置文件等数据,非必要不要操作!!)。
[root@node1 ceph-cluster]# ceph-deploy  purge  node1  node2  node3
[root@node1 ceph-cluster]# ceph-deploy  purgedata  node1  node2  node3

创建OSD

初始化清空磁盘数据(仅node1操作即可)。

初始化磁盘,将所有磁盘分区格式设置为GPT格式(根据实际情况填写磁盘名称)。

[root@node1 ceph-cluster]# ceph-deploy disk  zap  node1:vdb   node1:vdc   
[root@node1 ceph-cluster]# ceph-deploy disk  zap  node2:vdb   node2:vdc
[root@node1 ceph-cluster]# ceph-deploy disk  zap  node3:vdb   node3:vdc  
#相当于ssh 远程node1,在node1执行parted /dev/vdb  mktable  gpt
#其他主机都是一样的操作
#ceph-deploy是个脚本,这个脚本会自动ssh远程自动创建gpt分区

验证测试

查看集群状态。

[root@node1 ~]#  ceph  -s
[root@node1 ~]#  ceph   osd   tree

常见错误(非必须操作)。

如果查看状态包含如下信息:

health: HEALTH_WARN
        clock skew detected on  node2, node3…  

clock skew表示时间不同步,解决办法:请先将所有主机的时间都使用NTP时间同步!!!

Ceph要求所有主机时差不能超过0.05s,否则就会提示WARN。

如果状态还是失败,可以尝试执行如下命令,重启所有ceph服务:

[root@node1 ~]#  systemctl restart ceph.target

创建Ceph块存储

  • 创建块存储镜像
  • 客户端映射镜像
  • 删除镜像

创建镜像

查看存储池,默认存储池名称为rbd。

[root@node1 ~]# ceph osd lspools
0 rbd,
#查看结果显示,共享池的名称为rbd,这个共享池的编号为0,英语词汇:pool(池塘、水塘)

创建镜像、查看镜像

[root@node1 ~]# rbd create demo-image --size 10G
#创建demo-image镜像,这里的demo-image创建的镜像名称,名称可以为任意字符。
#size可以指定镜像大小
[root@node1 ~]# rbd create rbd/jacob  --size 10G
#在rbd池中创建名称为jacob的镜像(rbd/jacob),镜像名称可以任意
[root@node1 ~]# rbd list                    #列出所有镜像
[root@node1 ~]# rbd info demo-image        #查看demo-image这个镜像的详细信息
rbd image 'demo-image':
    size 10240 MB in 2560 objects
    order 22 (4096 kB objects)
    block_name_prefix: rbd_data.d3aa2ae8944a
    format: 2
    features: layering

动态调整

扩容容量

[root@node1 ~]# rbd resize --size 15G jacob             
#调整jacob镜像的大小,jacob是镜像的名称,size指定扩容到15G
[root@node1 ~]# rbd info jacob

缩小容量

[root@node1 ~]# rbd resize --size 7G jacob --allow-shrink
#英文词汇:allow(允许),shrink(缩小)
[root@node1 ~]# rbd info jacob
#查看jacob这个镜像的详细信息(jacob是前面创建的镜像)

通过KRBD访问

客户端通过KRBD访问

#客户端需要安装ceph-common软件包
#拷贝配置文件(否则不知道集群在哪)
#拷贝连接密钥(否则无连接权限)
[root@client ~]# yum -y  install ceph-common
[root@client ~]# scp 192.168.4.11:/etc/ceph/ceph.conf  /etc/ceph/
[root@client ~]# scp 192.168.4.11:/etc/ceph/ceph.client.admin.keyring \
/etc/ceph/
[root@client ~]# rbd map  jacob          #客户端访问映射服务器的jacob共享镜像
[root@client ~]#  lsblk                   #查看结果(会多一块磁盘)
[root@client ~]# rbd showmapped          #查看磁盘名和共享镜像名称的对应关系
id pool image snap device    
0  rbd  jacob -    /dev/rbd0

客户端格式化、挂载分区

[root@client ~]# mkfs.xfs /dev/rbd0                     #格式化,格式为xfs
[root@client ~]# mount /dev/rbd0 /mnt/                  #挂载(可以挂载到任意目录)
[root@client ~]# echo "test" > /mnt/test.txt           #写入数据

删除镜像

客户端撤销磁盘映射

[root@client ~]# umount /mnt                      #卸载
[root@client ~]# rbd showmapped                  #查看磁盘名和共享镜像名称的对应关系
id pool image        snap device    
0  rbd  jacob        -    /dev/rbd0
[root@client ~]# rbd unmap /dev/rbd0            #撤销磁盘映射

知识总结

一、准备工作:
IP,主机名,hosts解析,ssh密钥,时间同步,yum源,防火墙,selinux
二、部署ceph:
1.安装软件

2.修改配置启动服务mon

3.启动osd服务共享硬盘

块存储应用案例

实现以下功能:

  • 创建镜像快照
  • 使用快照还原数据
  • 使用快照克隆镜像
  • 删除快照

创建镜像快照

查看镜像快照(默认所有镜像都没有快照)。

 [root@node1 ~]# rbd snap ls jacob
#查看某个镜像有没有快照,jacob是镜像的名称,ls是list查看

给镜像创建快照。

[root@node1 ~]# rbd snap create jacob --snap jacob-snap1
#为jacob镜像创建快照,--snap指定快照名称,快照名称为jacob-snap1,快照名称可以任意
[root@node1 ~]# rbd snap ls jacob
SNAPID NAME            SIZE 
     4 jacob-snap1 15360 MB

删除客户端写入的测试文件

[root@client ~]# rm  -rf   /mnt/test.txt
[root@client ~]# umount  /mnt

还原快照

[root@node1 ~]# rbd snap rollback jacob --snap jacob-snap1
# rollback是回滚的意思,使用jacob-snap1快照回滚数据,对jacob镜像进行回滚数据
[root@client ~]# mount /dev/rbd0 /mnt/        #客户端重新挂载分区
[root@client ~]# ls  /mnt                      #查看数据是否被恢复

创建快照克隆

克隆快照

[root@node1 ~]#  rbd snap protect jacob --snap jacob-snap1    #保护快照
#jacob是镜像名称,jacob-snap1是前面创建的快照(被保护的快照,不可以被删除)
[root@node1 ~]#  rbd snap rm jacob --snap jacob-snap1    #删除被保护的快照,会失败
[root@node1 ~]#  rbd clone \
jacob --snap jacob-snap1 jacob-clone --image-feature layering
#使用jacob镜像的快照jacob-snap1克隆一个新的名称为jacob-clone的镜像
#新镜像名称可以任意

查看克隆镜像与父镜像快照的关系

[root@node1 ~]#  rbd info jacob-clone
rbd image 'jacob-clone':
    size 15360 MB in 3840 objects
    order 22 (4096 kB objects)
    block_name_prefix: rbd_data.d3f53d1b58ba
    format: 2
    features: layering
    flags: 
    parent: rbd/jacob@jacob-snap1
#克隆镜像的很多数据都来自于快照链(相当于文件的软链接的概念)
#如果希望克隆镜像可以独立工作,就需要将父快照中的数据,全部拷贝一份,但比较耗时!!!
[root@node1 ~]#  rbd flatten jacob-clone        #让新克隆的镜像与快照脱离关系
[root@node1 ~]#  rbd info jacob-clone            #查看镜像信息
rbd image 'jadob-clone':
    size 15360 MB in 3840 objects
    order 22 (4096 kB objects)
    block_name_prefix: rbd_data.d3f53d1b58ba
    format: 2
    features: layering
    flags: 
#注意,父快照信息没了!

删除快照

[root@node1 ~]#  rbd snap unprotect jacob --snap jacob-snap1     #取消快照保护
[root@node1 ~]#  rbd snap rm jacob --snap jacob-snap1            #可以删除快照

Ceph文件系统

实现Ceph文件系统的功能。具体实现有以下功能:

  • 部署MDSs节点
  • 创建Ceph文件系统
  • 客户端挂载文件系统

前面的块共享,仅允许同时一个客户端访问,无法实现多人同时使用块设备。

而Ceph的文件系统共享则允许多人同时使用。

下面假设使用虚拟机node3,部署MDS节点。

主机的主机名及对应的IP地址如表-1所示。

步骤

实现此案例需要按照如下步骤进行。

1)添加一台虚拟机node3,要求如下:

IP地址:192.168.4.13

主机名:node3

配置yum源(包括操作系统的源、ceph的源)

与Client主机同步时间

node1允许无密码远程node3

修改node1的/etc/hosts,并同步到所有node主机

2)部署元数据服务器

登陆node3,安装ceph-mds软件包(如果前面课程已经安装,此步骤可以忽略)

[root@node3 ~]# yum -y install ceph-mds 

登陆node1部署节点操作

[root@node1 ~]# cd  /root/ceph-cluster
#该目录,是最早部署ceph集群时,创建的目录
[root@node1 ceph-cluster]# ceph-deploy mds create node3
#远程nod3,拷贝集群配置文件,启动mds服务

创建存储池

备注:一个文件系统是由inode和block两部分组成,效果如图-1所示。
Ceph集群与Ceph块存储

inode存储文件的描述信息(metadata元数据),block中存储真正的数据。

[root@node3 ~]# ceph osd pool create cephfs_data 64
#创建存储池,共享池的名称为cephfs_data,对应有64个PG
#共享池名称可以任意
[root@node3 ~]# ceph osd pool create cephfs_metadata 64
#创建存储池,共享池的名称为cephfs_metadata,对应有64个PG

PG是一个逻辑概念,没有对应的物质形态,是为了方便管理OSD而设计的概念。

为了方便理解,可以把PG想象成为是目录,可以创建32个目录来存放OSD,也可以创建64个目录来存放OSD。

创建Ceph文件系统

[root@node3 ~]# ceph fs new myfs1 cephfs_metadata cephfs_data
#myfs1是名称,名称可以任意,注意,先写metadata池,再写data池
#fs是filesystem的缩写,filesystem中文是文件系统
#默认,只能创建1个文件系统,多余的会报错
[root@node3 ~]# ceph fs ls
name: myfs1, metadata pool: cephfs_metadata, data pools: [cephfs_data ]

客户端挂载(客户端需要安装ceph-common,前面的课程已经安装)

[root@client ~]# mount -t ceph 192.168.4.11:6789:/  /mnt  \
-o name=admin,secret=AQBTsdRapUxBKRAANXtteNUyoEmQHveb75bISg==
#注意:-t(type)指定文件系统类型,文件系统类型为ceph
#-o(option)指定mount挂载命令的选项,选项包括name账户名和secret密码
#192.168.4.11为MON节点的IP(不是MDS节点),6789是MON服务的端口号
#admin是用户名,secret后面是密钥
#密钥可以在/etc/ceph/ceph.client.admin.keyring中找到
思考题:请问lsblk和df命令的区别?

如果做NFS的实验,客户端不安装nfs-utils是否可以mount成功?

##扩展知识:创建ceph用户,查看用户##

    [root@node1 ~]# ceph auth get-or-create client.nb \
    osd  'allow *' \
    mds  'allow *' \
    mon  'allow *'      > 文件名
# >是重定向导出,后面的文件名可以任意,没有文件会创建,有文件则会覆盖文件的内容
    [root@node1 ~]# ceph auth list              #查看所有用户列表

创建对象存储服务器

实现Ceph对象存储的功能。具体实现有以下功能:

  • 安装部署Rados Gateway
  • 启动RGW服务
  • 设置RGW的前端服务与端口
  • 客户端测试

部署对象存储服务器

准备实验环境,要求如下:

IP地址:192.168.4.13

主机名:node3

配置yum源(包括操作系统的源、ceph的源)

与Client主机同步时间

node1允许无密码远程node3

修改node1的/etc/hosts,并同步到所有node主机

部署RGW软件包

[root@node3 ~]# yum -y install ceph-radosgw

新建网关实例

拷贝配置文件,启动一个rgw服务

[root@node1 ~]# cd /root/ceph-cluster
[root@node1 ~]# ceph-deploy rgw create node3        #远程mode3启动rgw服务

登陆node3验证服务是否启动

[root@node3 ~]# ps aux |grep radosgw
ceph      4109  0.2  1.4 2289196 14972 ?       Ssl  22:53   0:00 /usr/bin/radosgw -f --cluster ceph --name client.rgw.node3 --setuser ceph --setgroup ceph
[root@node3 ~]# systemctl  status ceph-radosgw@\*

修改服务端口

登陆node3,RGW默认服务端口为7480,修改为8000或80更方便客户端记忆和使用

[root@node3 ~]#  vim  /etc/ceph/ceph.conf
[client.rgw.node3]
host = node3
rgw_frontends = "civetweb port=8000"
#node3为主机名
#civetweb是RGW内置的一个web服务
[root@node3 ~]# systemctl  restart ceph-radosgw@\*

客户端测试

curl测试

[root@client ~]# curl  192.168.4.13:8000

使用第三方软件访问

登陆node3(RGW)创建账户

[root@node3 ~]#  radosgw-admin user create \
--uid="testuser" --display-name="First User"
… …
"keys": [
        {
            "user": "testuser",
            "access_key": "5E42OEGB1M95Y49IBG7B",
            "secret_key": "i8YtM8cs7QDCK3rTRopb0TTPBFJVXdEryRbeLGK6"
        }
    ],
[root@node5 ~]# radosgw-admin user info --uid=testuser
//testuser为用户名,access_key和secret_key是账户密钥

客户端安装软件(软件需要自己上网搜索下载)

[root@client ~]#  yum install s3cmd-2.0.1-1.el7.noarch.rpm

修改软件配置(注意,除了下面设置的内容,其他提示都默认回车)

[root@client ~]#  s3cmd --configure
Access Key: 5E42OEGB1M95Y49IBG7BSecret Key: i8YtM8cs7QDCK3rTRopb0TTPBFJVXdEryRbeLGK6
S3 Endpoint [s3.amazonaws.com]: 192.168.4.13:8000
[%(bucket)s.s3.amazonaws.com]: %(bucket)s.192.168.4.13:8000
Use HTTPS protocol [Yes]: No
Test access with supplied credentials? [Y/n] n
Save settings? [y/N] y
#注意,其他提示都默认回车

创建存储数据的bucket(类似于存储数据的目录)

[root@client ~]# s3cmd ls
[root@client ~]# s3cmd mb s3://my_bucket
Bucket 's3://my_bucket/' created
[root@client ~]# s3cmd ls
2018-05-09 08:14 s3://my_bucket
[root@client ~]# s3cmd put /var/log/messages s3://my_bucket/log/
[root@client ~]# s3cmd ls s3://my_bucket
DIR s3://my_bucket/log/
[root@client ~]# s3cmd ls s3://my_bucket/log/
2018-05-09 08:19 309034 s3://my_bucket/log/messages 

测试下载功能

[root@client ~]# s3cmd get s3://my_bucket/log/messages /tmp/

测试删除功能

[root@client ~]# s3cmd del s3://my_bucket/log/messages

Ceph操作思路

准备工作

IP,主机名,hosts解析,ssh密钥,时间同步,yum源,防火墙,selinux

二、部署ceph:

1.安装软件

2.修改配置启动服务mon

3.启动osd共享硬盘

三、使用Ceph思路:

1.块共享

2.文件系统共享(文件系统由inode和block)

服务器: 创建两个共享池(名称任意)

使用两个共享池合并一个文件系统

安装ceph-mds软件,并启动服务(ceph-deploy mds create node3)

  客户端: mount  -t  MON的IP:6789:/   /挂载点   -o  name=用户名,secret=密码

3.对象存储

服务器启动一个radosgw即可(RGW)


四、ceph-deploy脚本用法:

  ceph-deploy  new   node1  node2  node3    #生成配置文件
   ceph-deploy  mon   create-initial         #远程所有主机启动mon服务
   ceph-deploy  disk zap  主机名:磁盘名       #初始化磁盘
   ceph-deploy  osd   create  主机名:磁盘名   #远程主机并启动osd服务
   ceph-deploy  mds   create   主机名        #远程主机并启动mds服务
   ceph-deploy  rgw  create  主机名          #远程主机并启动RGW服务
上一篇:Ceph-1


下一篇:为什么Ceph比Glusterfs更适合接入k8s