集群中大量Pod处于UnexpectedAdmissionError状态怎么办
问题描述
NAME READY STATUS RESTARTS AGE aos-apiserver-5f8f5b5585-s9l92 0/1 UnexpectedAdmissionError 0 3d1h aos-cmdbserver-789bf5b497-6rwrg 0/1 UnexpectedAdmissionError 0 3d1h aos-controller-545d78bs8d-vm6j9 0/1 UnexpectedAdmissionError 3 3d1h ...
问题根因
Pod被调度器调度到某个节点上后,节点资源不满足Pod申请的资源(CPU、Memory、异构资源)等,导致该Pod会被Kubelet拒绝,进入终态Failed状态。
解决方案
处于UnexpectedAdmissionError状态的Pod不会被立即清理。当集群中处于终态(包括Completed和UnexpectedAdmissionError状态)的Pod数量超过1000时,系统将进行集中清理。终态Pod占用的资源已被释放,查询时仅会显示其状态记录,便于后续问题排查和定位。若无需保留此类Pod,可直接手动删除。