节点kubeadm创建k8s集群一直失败排查

怎么创建群  时间:2021-03-20  阅读:()

kubeadm创建k8s集群一直失败排查

背景

某环境使用kubeadm创建3个master节点的高可用集群但是一直失败。

img

排查

1 .从日志可以看出 10.197.145.24为集群的kube-api的地址使用kubeadmjoin命令想把10.197.145.25节点添加到集群时报错报错提

示/etc/kubernetes/kubelet.conf  /etc/kubernetes/bootstrap-kubelet.conf存在貌似是节点残留文件导致节点join失败。

2.使用清理脚本清理10.197.145.25的残留从新添加节点发现错误仍然存在且报错内容一样清理脚本如下

#!/bin/bashrm -rf /etc/kubernetessystemctl stop kubelet 2>/dev/nulldocker rm -f $(docker ps -aq) 2>/dev/nullsystemctl stop docker 2>/dev/nullip link del cni0 2>/etc/nullfor port in 80 2379 6443 8086 {10249. .10259} ; dofuser -k -9 ${port}/tcpdonerm -fv /root/.kube/configrm -rfv /var/lib/kubeletrm -rfv /var/lib/cnirm -rfv /etc/cnirm -rfv /var/lib/etcdrm -rfv /var/lib/postgresql /etc/core/token /var/lib/redis /storage /chart_storagesystemctl start docker 2>/dev/null

3.于是检查10.197.145.25节点情况docker和kubelet运行情况

• systemctl status docker

该节点docker进程为active和running的

• systemctl status kublet

节点kubelet进程为inactive状态

4.通过syste mctl restart kubelet重启kubelet进程发现启动后kubelet进程启动后一会后进程退出。

5.检查节点的message日志发现kubelet有如下报错kubelet: F0727 11:39:07.530805 23779 docker_service.go:414] Streaming server stopped unexpectedly: listen tcp

172.0.0.1:0: bind: cannot assign requested address

image-20200731221748691

1 . google上述错误发现如下链接

Minikube Start Fai lure

检查该节点的/etc/hosts,确实发现没有localhost的解析文件了。经咨询得知客户为了配置一个域名的自定义解析采用了echo “1.2.3.4 a.b.co m” > /etc/hosts的操作导致/etc/hosts中localhost解析被清空。

解决

参照https://coding-stream-of-consciousness.com/2020/01/15/minikube-start-fai lure-streaming-server-stopped-cannot-assign-requested-address/修复方式我们在/etc/hosts文件中增加localhost解析后 kubelet启动正常了节点添加成功。

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

: :1 localhost localhost.localdomain localhost6 localhost6.localdomain6

后记

1 . /etc/hosts中localhost的回环地址解析绝大多数应用都会依赖因此生产环境绝对不能删除。

2.在使用kubeadm创建k8s集群时进行必备条件的checkl ist检查常见检查条件如下

• 内核模块

须加载iptable_nat  br_netfi lter内核模块

• 内核参数net.ipv4.ip_forward = 1net.bridge.bridge-nf-call-iptables = 1net.bridge.bridge-nf-call-arptables = 1

• 关闭sel inux

参照官方文档 https://kubernetes. io/docs/tasks/configure-pod-container/security-context/ 新版本的kubernetes可以开启sel inux但是sel inux配置很复杂开启sel inux时 docker可能无法创建出容器。除非安全要求很严格的场景一般情况建议关闭。

• 关闭节点swap

默认开启swap会导致kubelet无法启动

• 时间同步节点时区统一

建议时区设置为Asia/Shanghai

• 防火墙设置kubernetes组件运行需要的端口须保持开放如6443  2379 2380等。

• /etc/hosts文件

所有服务器可以通过hostname解析成ip 可以将localhost解析成127.0.0.1 同时hosts文件内不能有重复的hostname。

• /tmp/权限

/tmp目录的权限是777

• 集群全部节点安装socat软件包socat不仅kubeadm创建集群需要 helm使用时也需要。

• iptablesiptables FORWARD链为ACCEPTiptables -P FORWARD ACCEPT

HoRain Cloud:国内特价物理机服务器,镇江机房,内地5线BGP接入,月付499元起

horain怎么样?horain cloud是一家2019年成立的国人主机商家,隶属于北京辰帆科技有限公司,horain持有增值电信业务经营许可证(B1-20203595),与中国电信天翼云、腾讯云、华为云、UCloud、AWS等签署渠道合作协议,主要提企业和个人提供云服务器,目前商家推出了几款特价物理机,都是在内地,性价比不错,其中有目前性能比较强悍的AMD+NVMe系列。点击进入:horain...

老薛主机VPS年付345元,活动进行时。

老薛主机,虽然是第一次分享这个商家的信息,但是这个商家实际上也有存在有一些年头。看到商家有在进行夏季促销,比如我们很多网友可能有需要的香港VPS主机季度及以上可以半价优惠,如果有在选择不同主机商的香港机房的可以看看老薛主机商家的香港VPS。如果没有记错的话,早年这个商家是主营个人网站虚拟主机业务的,还算不错在异常激烈的市场中生存到现在,应该算是在众多商家中早期积累到一定的用户群的,主打小众个人网站...

鲸云10美元,香港BGPRM 1核 1G 10Mbps峰值带宽 1TB流量,江西CN2-NAT 1核 512MB内存 100M带宽 ,

WHloud Official Notice(鲸云官方通知)(鲸落 梦之终章)]WHloud RouMu Cloud Hosting若木产品线云主机-香港节点上新预售本次线路均为电信CN2 GIA+移动联通BGP,此机型为正常常规机,建站推荐。本次预售定为国庆后开通,据销售状况决定,照以往经验或有咕咕的可能性,但是大多等待时间不长。均赠送2个快照 2个备份,1个默认ipv4官方网站:https:/...

怎么创建群为你推荐
ym.163.com网易163企业邮箱的foxmail怎样设置?重庆400年老树穿楼生长重庆海拔500左右的红沙土适合栽哪种果树美要求解锁iPhoneiphone美版解锁硬解大概需要多少钱啊本公司www文档下载如何 下载 文库文件大飞资讯手机出现热点资讯怎么关闭瞄准的拼音穿越火线枪战王者辅助瞄准什么意思狙击辅助网络u盘网吧网络U盘是怎么弄的400电话查询400电话。如何查询真伪,费用?欢迎光临本店鸡蛋蔬菜饺子每个10个3元,牛肉蔬菜饺子每10个5元,欢迎光临本店! 汉译英
虚拟主机管理系统 linuxvps 仿牌空间 主机 国外php主机 国外服务器网站 gomezpeer 卡巴斯基官方免费版 刀片服务器的优势 万网空间购买 双线机房 新睿云 腾讯总部在哪 美国盐湖城 万网空间 免费稳定空间 腾讯网盘 阿里云邮箱申请 SmartAXMT800 websitepanel 更多