本文主要梳理删除Pod时,Pod的执行流程
kube-apiserver的任务
我们通常使用kubectl命令删除Pod,或者通过http协议直接调用apiserver暴露的接口去删除Pod。所以,删除Pod的起源肯定在apiserver这儿。
在之前分析kube-apiserver部分有分析到,kube-apiserver的http处理架构使用的是go-restful。其中,对于删除,调用的自然是DELETE接口。方法如下(位于kubernetes/staging/src/k8s.io/apiserver/pkg/endpoints/install.go下的registerResourceHandlers方法
)
restfulDeleteResource
restfulDeleteResource
继续封装handler,调用了DeleteResource
方法。DeleteResource
方法很长,但最终调用的还是DELETE
方法,如下
DELETE
方法位于staging/src/k8s.io/apiserver/pkg/registry/generic/registry/store.go
下。在DELETE
方法中,最主要的是updateForGracefulDeletionAndFinalizers
方法,该方法的主要作用就是用来改变Pod的一些内部信息,其实就是改变Pod的两个字段:DeletionTimestamp以及DeletionGracePeriodSeconds,调用的是BeforeDelete
方法
kubelet的任务
通过之前分析过kubelet的代码得知,kubelet一直在通过listwatch监听apiserver的变化
start方法如下:
深层分析
我们知道,Pod的删除如果不去强制删除,则其实是一个优雅的删除,也就是一个graceful的删除。默认情况下,这个优雅的时间是30s,也就是grace-period的时间。在kube-apiserver的任务中,通过updateForGracefulDeletionAndFinalizers
方法为Pod设置了DeletionTimestamp和DeletionGracePeriodSeconds两个字段,此时Pod定义为graceful的状态。回到代码处,调用完updateForGracefulDeletionAndFinalizers
方法后,下面有一个判断的语句
没错,实际情况的确是这样,每次删除的时候,apiserver的处理逻辑到此就中断了。接下来就要重新认识kubelet了。
Kubelet在调用apiserver的删除接口的时候,提前会有一个判断,调用链为
canBeDeleted-->PodResourcesAreReclaimed
。在PodResourcesAreReclaimed
方法内,主要的任务就是判断Pod内的资源是否已经完全关闭和清理,包括containers
、processes
、volumes
以及cgroup sandbox
资源。
canBeDeleted
方法返回true,kubelet调用apiserver的delete接口再次删除Pod。不过,与优雅删除不同的是,这次调用,多了一个deleteOptions
字段
总结
优雅删除Pod时:
1、apiserver handler执行了两次,第一次主要是修改Pod信息,设置DeletionTimestamp和DeletionGracePeriodSeconds信息,第二次去数据库etcd删除Pod信息;
2、kubelet通过检测到Pod内的资源已经完全释放之后,触发了第二次删除事件,且是强制删除Pod;
3、kubelet的DELETE操作其实监听到的是Pod的更新事件,Pod删除之后,执行的是REMOVE操作;
4、处理流程为:客户端请求删除Pod-->apiserver更新Pod信息-->kubelet优雅释放Pod资源-->kubelet请求删除Pod-->apiserver删除etcd中Pod信息-->kubelet完成最终Pod的资源清理
。