Kubernetes集群docker卡死操作记录

Published on with 40 views

docker卡死的判断:
在master机器上通过kubetcl get po -n ${namespace} -o wide 发现某个pod处于terminal状态,无法消除。根据其所属服务器ip,判断是哪台服务器docker卡死。

docker卡死对应服务器重启流程
通过kubectl get nodes 查看节点,例如192.168.1.1处于卡死状态,
驱赶node上的pod:
kubectl drain 192.168.1.1 --delete-local-data
断开node节点:
kubectl delete node 192.168.1.1
然后重启服务器:
shutdown -r now

服务器重启后的服务启动流程
挂载磁盘
mount /dev/vdb1 /extdatdisk
启动flanneld网络
systemctl start flanneld

启动docker
systemctl start docker.service
启动k8s
systemctl start kubelet.service
systemctl start kube-proxy.service
配置网络
iptables -P FORWARD ACCEPT


标题:Kubernetes集群docker卡死操作记录
作者:jenphyjohn
地址:http://blog.join-e.tech/articles/2020/04/04/1585975363714.html

Responses