k8s集群中一台etcd的pod异常
记一次etcd报错2380bind already in use杀掉容器依然无效
起初通过命令:kubectl get pod -n kube-system 发现etcd容器异常
在主节点通过kubectl logs查看pod日志发现很明显的报错端口被占用
当时查看2380端口确实有在占用
通过nerdctl stop指令试着停了下etcd容器,确认端口没有在被监听了,后面我又start了,kubectl logs查看依然是被占用状态
在etcd节点查看容器日志报错发现是找不到对应pod日志文件证明该pod在创建时候就出现了问题还没有运行
梳理了下可能出现这种情况的原因是“旧的etcd进程并没有完全退出,导致在启动新的etcd一直失败状态即使stop start也无效”
后面直接kill掉了etcd进程的pid,再次查看pod发现启动正常,查看etcd集群也是正常的了