Kubernetes(K8s) 安装(使用kubeadm安装Kubernetes集群)

Kubernetes(K8s) 安装(使用kubeadm安装Kubernetes集群)
概述:

这篇文章是为了介绍使用kubeadm安装Kubernetes集群(可以用于生产级别)。使用了Centos 7系统。

PS:

篇幅有点长,但是比较详细、比较全面

一、Centos7 配置说明
1.1   Firewalld(防火墙)
CentOS Linux 7 默认开起来防火墙服务(firewalld),而Kubernetes的Master与工作Node之间会有大量的网络通信,安全的做法是在防火墙上配置Kbernetes各组件(api-server、kubelet等等)需要相互通信的端口号。在安全的内部网络环境中可以关闭防火墙服务。

关闭防火墙的命令:

1 # firewall-cmd --state #查看防火墙状态
2 # systemctl stop firewalld.service #停止firewall
3 # systemctl disable firewalld.service #禁止firewall开机启动
1.2   SELinux
建议禁用SELinux,让容器可以读取主机文件系统

执行命令:

1 # getenforce #查看selinux状态
2 # setenforce 0 #临时关闭selinux
3 # sed -i 's/^ *SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config #永久关闭(需重启系统)
4 # shutdown -r now #重启系统
二、安装准备工作
2.1   安装环境
软硬件

最低配置

推荐配置

CPU和内存
Master: 至少2 Core和4G内存

Node:至少4 Core和16G内存

Master:4 core和16G内存

Node:应根据需要运行的容器数量进行配置

Linux操作系统 基于x86_64架构的各种Linux发行版本,Kernel版本要求在3.10及以上
Red Hat Linux 7

CentOS 7

说明:

以上为建议配置,实际安装过程中,Master必须2 core 及以上(否则安装失败,切记),Node可以采用1 core。

2.2   部署环境说明
主机列表:

主机名

Centos版本

ip

docker version

flannel version

Keepalived version

主机配置

备注

master01

7.6.1810

192.168.0.6

18.09.9

v0.11.0

v1.3.5

2C1G

control plane

work01

7.6.1810

192.168.0.10

18.09.9

/

/

1C1G

worker nodes

work02

7.6.1810

192.168.0.12

18.09.9

/

/

1C1G

worker nodes

VIP

7.6.1810

192.168.0.130

18.09.9

v0.11.0

v1.3.5

4C4G

在control plane上浮动

client

7.6.1810

192.168.0.234

/

/

/

4C4G

client(可不需要)

共有7台服务器,3台control plane,3台work,1台client。

k8s 版本(可根据需要进行更改):

主机名

kubelet version

kubeadm version

kubectl version

备注

master01

v1.16.4

v1.16.4

v1.16.4

kubectl选装

work01

v1.16.4

v1.16.4

v1.16.4

kubectl选装

work02

v1.16.4

v1.16.4

v1.16.4

kubectl选装

client

/

/

v1.16.4

client

2.3. 配置主机名(master和node节点都执行)
2.3.1 修改主机名
Master主机改为master01,执行以下命令:

1 # hostnamectl set-hostname master01 #修改主机名称为master01
2 # more /etc/hostname #查看修改结果
同样的修改node01和node02(注意主机名为node01和node02)

说明:

退出重新登陆即可显示新设置的主机名master01,重新登录之后

2.3.2 修改hosts文件
执行以下命令:

cat >> /etc/hosts << EOF
192.168.0.6 master01
192.168.0.10 node01
192.168.0.12 node02
EOF
2.3.3 禁用swap
Kubeadm建议关闭交换空间的使用,简单来说,执行swapoff -a命令,然后在/etc/fstab中删除对swap的加载,并重新启动服务器即可。

临时禁用,执行以下命令:

swapoff -a

永久禁用,需要在swapoff -a之后,执行以下命令:

sed -i.bak '/swap/s/^/#/' /etc/fstab

2.3.4 设置kubernetes源
2.3.4.1 新增kubernetes源
执行以下命令:

cat < /etc/yum.repos.d/kubernetes.repo

[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF

2.3.4.2 更新缓存

yum clean all

yum -y makecache

三、Docker安装(master和node节点都执行)
注意:

安装docker之前,最好确认一下,kubernetes支持哪些版本的docker(kubernetes和docker的版本要对应,否则可能会造成重新安装)。

3.1 卸载/更新已经安装的Docker

卸载docker

1. 列出安装过的包

yum list installed | grep docker

2. 根据安装过的包进行卸载

yum -y remove docker-ce-cli.x86_64

yum -y remove docker-ce.x86_64

yum -y remove containerd.io

更新docker

yum -y update docker

3.2 安装Docker环境
3.2.1 配置docker源
如已安装过docker,则不需要进行此步骤

wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo

3.2.2 安装依赖包

yum install -y yum-utils device-mapper-persistent-data lvm2

3.2.3 设置从stable仓库获取docker

yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo

3.2.4 安装Docker

yum install docker-ce-18.09.9 docker-ce-cli-18.09.9 containerd.io -y

说明:

执行以上命令之前,可以看看docker版本,执行以下命令查看

yum list docker-ce --showduplicates | sort -r

3.2.5 启动Docker(并设置为开机启动)

systemctl start docker && systemctl enable docker

3.2.6 命令补全
安装bash-completion

yum -y install bash-completion

加载bash-completion

source /etc/profile.d/bash_completion.sh

3.2.7 镜像加速(并修改Cgoup Driver)

mkdir -p /etc/docker

tee /etc/docker/daemon.json <<-'EOF'

{

"registry-mirrors": ["https://usydjf4t.mirror.aliyuncs.com", 
"https://registry.docker-cn.com"]
, "exec-opts": ["native.cgroupdriver=systemd"]

}
EOF

systemctl daemon-reload

systemctl restart docker

说明:

修改cgroupdriver是为了消除告警:

四、Keepalived安装(master节点安装)
4.1 安装keepalived

yum -y install keepalived

4.2 keepalived配置
保留默认配置

mv /etc/keepalived/keepalived.conf /etc/keepalived/keepalived_default.conf

写入新的配置

cat < /etc/keepalived/keepalived.conf

! Configuration File for keepalived
global_defs {
router_id master01
}

vrrp_instance VI_1 {

state MASTER
interface enp0s3
virtual_router_id 50
priority 100
advert_int 1
authentication {
    auth_type PASS
    auth_pass 1111
}
virtual_ipaddress {
    192.168.0.130
}

}

EOF

说明:

特别注意红色字体文本,master01是主机名称(如果有其他主机则使用对应的主机名称进行替换),enp0s3是网卡名称(每个linux系统可能不一致),192.168.0.130是虚拟IP

4.3 启动keepalived

service keepalived start && systemctl enable keepalived

4.4 VIP查看
在master机器上执行

ip a

可以看到VIP在master01(目前只有一台master,以后可能会有多个master)上

五、安装k8s(master和node节点都执行)
5.1 查看kubernetes版本

yum list kubelet --showduplicates | sort -r

说明:

本文安装的kubelet版本是1.16.4,该版本支持的docker版本为1.13.1, 17.03, 17.06, 17.09, 18.06, 18.09。

5.2 安装kubelet、kubeadm和kubectl(注意版本号,根据需要进行改变)

yum install -y kubelet-1.16.4 kubeadm-1.16.4 kubectl-1.16.4

说明:

kubelet 运行在集群所有节点上,用于启动Pod和容器等对象的工具
kubeadm 用于初始化集群,启动集群的命令工具
kubectl 用于和集群通信的命令行,通过kubectl可以部署和管理应用,查看各种资源,创建、删除和更新各种组件
5.3 启动kubelet(并设置为开机启动)

systemctl enable kubelet && systemctl start kubelet

5.4 命令补全

echo "source <(kubectl completion bash)" >> ~/.bash_profile

source .bash_profile

5.5 下载镜像
Kubernetes几乎所有的安装组件和Docker镜像都放在goolge自己的网站上,直接访问可能会有网络问题,这里的解决办法是从阿里云镜像仓库下载镜像,拉取到本地以后改回默认的镜像tag。本文通过运行image.sh脚本方式拉取镜像。

直接执行以下命令(灰色背景部分):

more image.sh #以下为image.sh文件的内容

!/bin/bash

url=registry.cn-hangzhou.aliyuncs.com/loong576 #阿里云镜像仓库地址,可以按需修改
version=v1.16.4 #安装的kubernetes的版本(可以按需修改)
images=(kubeadm config images list --kubernetes-version=$version|awk -F '/' '{print $2}')
for imagename in ${images[@]} ; do
docker pull $url/$imagename
docker tag $url/$imagename k8s.gcr.io/$imagename
docker rmi -f $url/$imagename
done

注意:

如果需要下载其他的kubernetes版本,需要修改对应的版本号(红色字体部分)

5.6 查看已经下载的镜像

docker images

六、网络插件(flannel)配置(Master执行)
本文的k8s网络使用flannel,该网络需要设置内核参数bridge-nf-call-iptables=1,修改这个参数需要系统有br_netfilter模块。

说明:

K8s网络插件有很多,使用网络插件之前,要进行判断是否和系统适配。

6.1 br_netfilter模块加载
查看br_netfilter模块:

lsmod |grep br_netfilter

如果系统没有br_netfilter模块则执行下面的新增命令,如有则忽略。

永久新增br_netfilter模块:

cat > /etc/rc.sysinit << EOF

!/bin/bash

for file in /etc/sysconfig/modules/*.modules ; do
[ -x $file ] && $file
done
EOF

cat > /etc/sysconfig/modules/br_netfilter.modules << EOF

modprobe br_netfilter
EOF

chmod 755 /etc/sysconfig/modules/br_netfilter.modules

6.2 内核参数永久修改

cat < /etc/sysctl.d/k8s.conf

net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF

sysctl -p /etc/sysctl.d/k8s.conf

说明:

如安装网络插件之后,长时间状态没有变更,则可以试试重启机器(或者是虚拟机,这里是指Centos 7系统)。

七、初始化Master(Master节点执行)
说明:

Master的kubernetes之前,须先确定要确定的网络插件(因为可能会影响到初始化的参数),不同的系统可能需要使用不同的网络插件(Centos 不支持 Calico)。

建议先阅读网络插件资料。(Kubernetes所有网络插件说明:这里)

7.1 创建初始化文件
7.1.1 获取默认的初始化参数文件

kubeadm config print init-defaults > init.default.yaml

7.1.2 查看init.default.yaml文件

cat init.default.yaml

7.1.3 配置初始化文件
创建kubeadm.conf.yaml文件,输入以下内容(灰色背景部分):

apiVersion: kubeadm.k8s.io/v1beta2
kind: ClusterConfiguration
kubernetesVersion: v1.16.4
apiServer:
certSANs: #填写所有kube-apiserver节点的hostname、IP、VIP

  • master01
  • node01
  • node02
  • 192.168.0.6
  • 192.168.0.10
  • 192.168.0.12
  • 192.168.0.130
    controlPlaneEndpoint: "192.168.0.130:6443"

networking:
podSubnet: "10.244.0.0/16" #这里需要根据具体的网络插件来配置(这里使用的flannel网络插件配置)

说明:

注意红色字体部分内容,需要根据init.default.yaml文件和自己的需要进行更改

7.2 初始化kubernetes

kubeadm init --config=kubeadm.conf.yaml

说明:

如果初始化失败,可执行kubeadm reset后重新初始化(执行以下两条命令)

kubeadm reset

rm -rf $HOME/.kube/config

初始化成功,如下图:

按照提示执行下面的命令,复制配置文件到普通用户的home目录下:

mkdir -p $HOME/.kube

cp -i /etc/kubernetes/admin.conf $HOME/.kube/config

chown $(id -u):$(id -g) $HOME/.kube/config

在其他位置(或者主机),保存如下信息(其他node节点加入集群时使用):

You should now deploy a pod network to the cluster.

Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:

https://kubernetes.io/docs/concepts/cluster-administration/addons/

You can now join any number of control-plane nodes by copying certificate authorities
and service account keys on each node and then running the following as root:
kubeadm join 192.168.0.130:6443 --token afeqnz.vhp0e8rtrw6jz6v2 \

--discovery-token-ca-cert-hash sha256:d6a450aafb14e82efb69fbcb71e426bfed8e423d64b37bac85b3ff8ce7dc6562 \
--control-plane     

Then you can join any number of worker nodes by running the following on each as root:

node加入集群时使用

kubeadm join 192.168.0.130:6443 --token afeqnz.vhp0e8rtrw6jz6v2 \
--discovery-token-ca-cert-hash sha256:d6a450aafb14e82efb69fbcb71e426bfed8e423d64b37bac85b3ff8ce7dc6562

7.3 加载环境变量

echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> ~/.bash_profile

source .bash_profile

八、node节点加入集群
8.1 开启Master节点防火墙端口
说明:

如果master节点的防火墙已经关闭,可以直接跳过此小节

如果node已经加入其它集群,需要退出集群,请执行在node上执行:

kubeadm reset

查看防火墙状态:

systemctl status firewalld 或者 firewall-cmd --state

开启6443端口

firewall-cmd --zone=public --add-port=6443/tcp --permanent

出现success表明添加成功

命令含义:

--zone #作用域

--add-port=80/tcp #添加端口,格式为:端口/通讯协议

--permanent #永久生效,没有此参数重启后失效
重启防火墙

systemctl restart firewalld.service

说明:

Kubernetes集群中的Service可使用的物理机端口号范围为30000~32767

一次全部公开所有可能使用的端口:

firewall-cmd --zone=public --add-port=30000-32767/tcp --permanent

systemctl restart firewalld.service

8.2 加入集群
Master节点在初始化完成之后,最后一行代码,如下:

kubeadm join 192.168.0.130:6443 --token afeqnz.vhp0e8rtrw6jz6v2 \

--discovery-token-ca-cert-hash sha256:d6a450aafb14e82efb69fbcb71e426bfed8e423d64b37bac85b3ff8ce7dc6562

把两行信息复制出来,在node节点执行,如下图:(join成功)

在master节点,执行以下命令查看已经加入的节点

kubectl get nodes

说明:

由于没有安装网络插件,这里STATUS为NotReady

九、安装网络插件(Master)
在master主机上执行以下命令:

kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/2140ac876ef134e0ed5af15c65e414cf26827915/Documentation/kube-flannel.yml

说明:

由于网络原因,可能会安装失败,可以在浏览器直接下载kube-flannel.yml文件(也可以在浏览器打开url地址,然后复制文件内容到文件),然后再执行apply

查看节点状态,执行以下命令:

kubectl get nodes

说明:

STATUS从NotReady变为Ready

十、Client配置(client端执行)
10.1 新增kubernetes源

cat < /etc/yum.repos.d/kubernetes.repo

[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF

10.2 更新缓存

yum clean all && yum -y makecache

10.3 安装kubectl

yum install -y kubectl-1.16.4

10.4 命令补全
安装bash- completion

yum -y install bash-completion

加载bash-completion

source /etc/profile.d/bash_completion.sh

10.5 从Master节点拷贝admin.conf

mkdir -p /etc/kubernetes

scp 192.168.0.6:/etc/kubernetes/admin.conf /etc/kubernetes/

说明:

192.168.0.6 是master主机

echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> ~/.bash_profile

source .bash_profile

10.6 加载环境变量

echo "source <(kubectl completion bash)" >> ~/.bash_profile

source .bash_profile

10.7 Kubectl 测试

kubectl get nodes

kubectl get cs

kubectl get po -o wide -n kube-system

十一、Dashboard搭建(client端执行)
11.1 下载yaml

wget https://raw.githubusercontent.com/kubernetes/dashboard/v2.0.0-beta8/aio/deploy/recommended.yaml

说明:

如果连接超时,可以多试几次。也可以在这里下载

11.2 修改镜像地址

sed -i 's/kubernetesui/registry.cn-hangzhou.aliyuncs.com/loong576/g' recommended.yaml

说明:

也可以采用其他的一些镜像(切换镜像,需要更改recommended.yaml文件)

更改镜像操作:

如果需要更改镜像的版本号,需要在阿里云查询一下是否有镜像

下载镜像命令:(注意阿里云是没有带版本号的,需要自己录入版本号)

docker pull registry.cn-hangzhou.aliyuncs.com/kubernetesui/dashboard:v2.0.0-rc5

11.3 配置yaml
外网访问

sed -i '/targetPort: 8443/a nodePort: 30001n type: NodePort' recommended.yaml

说明:

配置NodePort,外部通过https://NodeIp:NodePort 访问Dashboard,此时端口为30001

11.4 新增管理员账号
创建超级管理员的账号用于登录Dashboard

cat >> recommended.yaml << EOF


------------------- dashboard-admin -------------------

apiVersion: v1
kind: ServiceAccount
metadata:
name: dashboard-admin

namespace: kubernetes-dashboard

apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRoleBinding
metadata:
name: dashboard-admin
subjects:

  • kind: ServiceAccount
    name: dashboard-admin

namespace: kubernetes-dashboard
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: cluster-admin
EOF

11.5 部署Dashboard

kubectl apply -f recommended.yaml

状态查看:

kubectl get all -n kubernetes-dashboard

令牌查看:

kubectl describe secrets -n kubernetes-dashboard dashboard-admin

令牌为(一定要注意可能存在换行的情况):

eyJhbGciOiJSUzI1NiIsImtpZCI6IllkWjQxWENEYnBXYV9rUlNqWTRldjVOYXV3M0tPTklYTVZTWUZWOXp0SHMifQ.eyJpc3MiOiJrdWJlcm5ldGVzL3NlcnZpY2VhY2NvdW50Iiwia3ViZXJuZXRlcy5pby9zZXJ2aWNlYWNjb3VudC9uYW1lc3BhY2UiOiJrdWJlcm5ldGVzLWRhc2hib2FyZCIsImt1YmVybmV0ZXMuaW8vc2VydmljZWFjY291bnQvc2VjcmV0Lm5hbWUiOiJkYXNoYm9hcmQtYWRtaW4tdG9rZW4tZzRwdzUiLCJrdWJlcm5ldGVzLmlvL3NlcnZpY2VhY2NvdW50L3NlcnZpY2UtYWNjb3VudC5uYW1lIjoiZGFzaGJvYXJkLWFkbWluIiwia3ViZXJuZXRlcy5pby9zZXJ2aWNlYWNjb3VudC9zZXJ2aWNlLWFjY291bnQudWlkIjoiNjNmNzllODUtNzMzMy00MDY1LTg1YTEtYzkxZTkzNjk3ZjA0Iiwic3ViIjoic3lzdGVtOnNlcnZpY2VhY2NvdW50Omt1YmVybmV0ZXMtZGFzaGJvYXJkOmRhc2hib2FyZC1hZG1pbiJ9.vsizK9ZP53to5aL5d1oyFYAiR8Kt1LaQ_Lkt86yPgHp6QloMS_pLCdD7KZi76deQ4ISTFC9Ldc62zslLtY4qgxNvSUiVWj1bWUn2BfCJ-3jPxpd7ZOgr3Gbp2xAFc3xjgm-qZaOydec9i44CbkdiVDoAjL0Au78yt7aHSW8B6plc2fAYNdywtyIOAMhe7f0gjyRaWrGQje2CVduITxZ-2NCwd3EYQNs31OA-zUPFvel_xi_KzdMBuj4z7DdvIK9wPQHyuke0TIs5dHSUEtiY84erLMg5i0ZGXCd019D5Nrsd78fVe_NbO-NThVReskA-jt1FyhAUesZie4GX-2eL3Q

说明:

如果安装Dashboard过程中出现问题,要仔细进行排查,可能pod还没有安装完成,等待一段时间之后,再看看,如果还是不行,则需要考虑一下中途是否有问题,是否需要重新安装。

如果忘记Token,可以通过以下命令获取:

kubectl describe secret -n kubernetes-dashboard $(kubectl get secret -n kubernetes-dashboard |grep kubernetes-dashboard-token | awk '{print $1}') |grep token | awk '{print $2}'

11.6 使用火狐浏览器浏览
https://192.168.0.6:30001

部署Dashboard之后,由于证书问题导致无法在浏览器浏览(暂时没有找到解决方案,尝试了网上的方式,不行,以下是尝试的过程(可以跳过))

删除已经部署的Dashboard

  1. kubectl delete ns kubernetes-dashboard

https://github.com/kubernetes/dashboard/releases

  1. 阅读参考资料(并执行命令,除了删除命令)

https://blog.51cto.com/10616534/2430512

十二、查找问题方式
12.1 查看Pod详细信息
查看所有Pod

kubectl get pods --all-namespaces

查看状态异常的Pod的详细信息

kubectl describe pod kubernetes-dashboard-8478d57dc6-p7jt7 --namespace=kubernetes-dashboard

说明:

可以看到在哪台Node上创建了容器

12.2 防火墙的问题
建议关闭防火墙

systemctl stop firewalld.service

systemctl disable firewalld.service

说明:

如果不关闭防火墙,可能会造成容器产生错误,如no host to route,是因为防火墙拦截了端口。

12.3 Dashboard 证书过期问题

12.4 Node节点执行kubectl命令出错问题
错误描述信息:

The connection to the server raw.githubusercontent.com was refused - did you specify the right host or port?
需要将master节点的 /etc/kubernetes/admin.conf 文件复制到node节点下。

参考资料
Kubernetes的安装:

https://www.kubernetes.org.cn/6632.html

CentOS Linux 开放端口:

https://www.cnblogs.com/archoncap/p/5402983.html

Kubernetes所有网络插件说明:

https://kubernetes.io/docs/setup/independent/create-cluster-kubeadm/#pod-network

原文地址https://www.cnblogs.com/zhizihuakai/p/12629514.html

上一篇:应用程序跑在Docker容器中会更安全


下一篇:文件系统-性能优化-磁臂调度算法