近期Bug Fix(v1.17.3)汇总
Kubernetes 1.17.3 于2020年2月中旬发布,该版本bug fix主要集中在监控和cloud provider,另外值得一提的还有EndpointSlice controller在某些场景下crash的bug。cloud provider相关的bug fix 均与Azure和AWS相关,本文暂不展开介绍。
1
监控领域bug fix
kube-scheduler scheduler_schedule_attempts_total 和 scheduler_pending_pods 两个metrics没有采集样本。
由于之前版本中将这两个metrics由Prometheus迁移到Metrics Stability Framework后,没有同步修改注册逻辑,导致这两个metric无法正常生成样本。
复现方法:
1
EndpointSlice controller crash
风险
EndpointSlice 特性由v1.16版本首次引入(alpha),在v1.17版本中虽然已提升至Beta,但默认特性开关为关闭状态。
EndpointSlice: {Default: false, PreRelease: featuregate.Beta}
由于 EndpointSlice Controller在修改EndpointSlice相关共享对象时未加以保护,有一定的机率导致panic,从而引发kube-controller-manager crash。具体技术细节请参考:
https://github.com/kubernetes/kubernetes/pull/85368
如果集群未启用该特性,则不受影响。该bug fix已同步在master分支上修改,此外该特性在即将发布的v1.18版本中将默认开启。