节点kubeadm创建k8s集群一直失败排查

怎么创建群  时间:2021-03-20  阅读:()

kubeadm创建k8s集群一直失败排查

背景

某环境使用kubeadm创建3个master节点的高可用集群但是一直失败。

img

排查

1 .从日志可以看出 10.197.145.24为集群的kube-api的地址使用kubeadmjoin命令想把10.197.145.25节点添加到集群时报错报错提

示/etc/kubernetes/kubelet.conf  /etc/kubernetes/bootstrap-kubelet.conf存在貌似是节点残留文件导致节点join失败。

2.使用清理脚本清理10.197.145.25的残留从新添加节点发现错误仍然存在且报错内容一样清理脚本如下

#!/bin/bashrm -rf /etc/kubernetessystemctl stop kubelet 2>/dev/nulldocker rm -f $(docker ps -aq) 2>/dev/nullsystemctl stop docker 2>/dev/nullip link del cni0 2>/etc/nullfor port in 80 2379 6443 8086 {10249. .10259} ; dofuser -k -9 ${port}/tcpdonerm -fv /root/.kube/configrm -rfv /var/lib/kubeletrm -rfv /var/lib/cnirm -rfv /etc/cnirm -rfv /var/lib/etcdrm -rfv /var/lib/postgresql /etc/core/token /var/lib/redis /storage /chart_storagesystemctl start docker 2>/dev/null

3.于是检查10.197.145.25节点情况docker和kubelet运行情况

• systemctl status docker

该节点docker进程为active和running的

• systemctl status kublet

节点kubelet进程为inactive状态

4.通过syste mctl restart kubelet重启kubelet进程发现启动后kubelet进程启动后一会后进程退出。

5.检查节点的message日志发现kubelet有如下报错kubelet: F0727 11:39:07.530805 23779 docker_service.go:414] Streaming server stopped unexpectedly: listen tcp

172.0.0.1:0: bind: cannot assign requested address

image-20200731221748691

1 . google上述错误发现如下链接

Minikube Start Fai lure

检查该节点的/etc/hosts,确实发现没有localhost的解析文件了。经咨询得知客户为了配置一个域名的自定义解析采用了echo “1.2.3.4 a.b.co m” > /etc/hosts的操作导致/etc/hosts中localhost解析被清空。

解决

参照https://coding-stream-of-consciousness.com/2020/01/15/minikube-start-fai lure-streaming-server-stopped-cannot-assign-requested-address/修复方式我们在/etc/hosts文件中增加localhost解析后 kubelet启动正常了节点添加成功。

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

: :1 localhost localhost.localdomain localhost6 localhost6.localdomain6

后记

1 . /etc/hosts中localhost的回环地址解析绝大多数应用都会依赖因此生产环境绝对不能删除。

2.在使用kubeadm创建k8s集群时进行必备条件的checkl ist检查常见检查条件如下

• 内核模块

须加载iptable_nat  br_netfi lter内核模块

• 内核参数net.ipv4.ip_forward = 1net.bridge.bridge-nf-call-iptables = 1net.bridge.bridge-nf-call-arptables = 1

• 关闭sel inux

参照官方文档 https://kubernetes. io/docs/tasks/configure-pod-container/security-context/ 新版本的kubernetes可以开启sel inux但是sel inux配置很复杂开启sel inux时 docker可能无法创建出容器。除非安全要求很严格的场景一般情况建议关闭。

• 关闭节点swap

默认开启swap会导致kubelet无法启动

• 时间同步节点时区统一

建议时区设置为Asia/Shanghai

• 防火墙设置kubernetes组件运行需要的端口须保持开放如6443  2379 2380等。

• /etc/hosts文件

所有服务器可以通过hostname解析成ip 可以将localhost解析成127.0.0.1 同时hosts文件内不能有重复的hostname。

• /tmp/权限

/tmp目录的权限是777

• 集群全部节点安装socat软件包socat不仅kubeadm创建集群需要 helm使用时也需要。

• iptablesiptables FORWARD链为ACCEPTiptables -P FORWARD ACCEPT

2021年7月最新洛杉矶CN2/香港CN2 vps套餐及搬瓦工优惠码 循环终身优惠6.58%

搬瓦工怎么样?2021年7月最新vps套餐推荐及搬瓦工优惠码整理,搬瓦工优惠码可以在购买的时候获取一些优惠,一般来说力度都在 6% 左右。本文整理一下 2021 年 7 月最新的搬瓦工优惠码,目前折扣力度最大是 6.58%,并且是循环折扣,续费有效,可以一直享受优惠价格续费的。搬瓦工优惠码基本上可能每年才会更新一次,大家可以收藏本文,会保持搬瓦工最新优惠码更新的。点击进入:搬瓦工最新官方网站搬瓦工...

宝塔面板批量设置站点404页面

今天遇到一个网友,他在一个服务器中搭建有十几个网站,但是他之前都是采集站点数据很大,但是现在他删除数据之后希望设置可能有索引的文章给予404跳转页面。虽然他程序有默认的404页面,但是达不到他引流的目的,他希望设置统一的404页面。实际上设置还是很简单的,我们找到他是Nginx还是Apache,直接在引擎配置文件中设置即可。这里有看到他采用的是宝塔面板,直接在他的Nginx中设置。这里我们找到当前...

RAKsmartCloud服务器,可自定义配置月$7.59

RAKsmart商家一直以来在独立服务器、站群服务器和G口和10G口大端口流量服务器上下功夫比较大,但是在VPS主机业务上仅仅是顺带,尤其是我们看到大部分主流商家都做云服务器,而RAKsmart商家终于开始做云服务器,这次试探性的新增美国硅谷机房一个方案。月付7.59美元起,支持自定义配置,KVM虚拟化,美国硅谷机房,VPC网络/经典网络,大陆优化/精品网线路,支持Linux或者Windows操作...

怎么创建群为你推荐
SetSysIdrouteinternalservererrorinternal server error重庆网络公司一九互联重庆网络公司,重庆网络优化,重庆页面制作性价比高且便宜的网络公司有哪些?重庆400年老树穿楼生长生长百年的老树,仍能不断生长,是因为主要有什么组织重庆杨家坪猪肉摊主杀人重庆九龙坡区治安好么支付宝账户是什么好评返现 要支付宝帐号 支付宝帐号是什么啊360防火墙在哪里电脑或电脑360有联网防火墙吗,在哪里设置文档下载请问手机版wps如何把云文档下载到手机上的本地文档?抢米网什么意思抢小米手机购物车什么叫淘宝购物车
免费cn域名 香港vps99idc kvmla 韩国俄罗斯 日志分析软件 远程登陆工具 好看的桌面背景图 台湾谷歌地址 中国电信测网速 美国免费空间 四核服务器 789电视剧 双线机房 秒杀品 服务器论坛 主机返佣 免费php空间 网络速度 免费获得q币 reboot 更多