Google Cloud Serverless计算产品:Cloud Run及相关技术解析
1. Cloud Run核心特性
1.1 并发请求限制
负载均衡器会将传入请求分配到可用的容器上,它通过并发请求限制来判断容器是否能接受新请求。可以把这个限制想象成每个容器的可用请求槽位数量,当容器处理请求时,会占用一个槽位。若容器没有可用槽位,负载均衡器不会再发送额外请求,每个容器的槽位数量设置称为并发度。
若所有容器都没有可用请求槽位,传入请求会暂时存放在请求缓冲区,直到有槽位释放。若没有可用容器,请求会等待新容器准备好。
例如,部署一个并发度为1的服务:
gcloud run deploy hello \
--image [IMAGE-URL] \
--concurrency 1
并发度为1适用于CPU密集型工作负载,也适用于非线程安全、一次只能处理一个请求的应用程序。
1.2 自动缩放器
自动缩放器会收集容器的指标,以确定处理请求所需的容器数量。它根据可用请求槽位数量采取行动,若槽位数量减少,会启动新容器(副本)以避免请求缓冲。
此外,自动缩放器还会关注容器的CPU利用率。若容器的CPU使用率高,即使还有足够的请求槽位,自动缩放器也可能决定添加容器,不过这通常是要避免的情况。
自动缩放器会在必要时持续添加容器,直到达到最大限制,默认最大限制为1000个容器,可进行调整。当Cloud Run达到最大限制时,会返回HTTP 429错误状态。需要注意的是,Clo
超级会员免费看
订阅专栏 解锁全文
690

被折叠的 条评论
为什么被折叠?



