Kubernetes v1.36:云控制器管理器中的路由同步新指标
本文最初发布时日期有误。后来重新发布,日期为 2026 年 5 月 15 日。
Kubernetes v1.36 在位于
k8s.io/cloud-provider
的云控制器管理器(CCM)路由控制器实现中引入了一个新的 Alpha 计数器指标
route_controller_route_sync_total。此指标在每次与云提供商同步路由时递增。
基于监视的路由调谐的 A/B 测试
添加此指标是为了帮助运维人员验证在
Kubernetes v1.35
中引入的 CloudControllerManagerWatchBasedRoutesReconciliation 特性门控。
此特性门控将路由控制器从固定间隔循环切换为基于监视的方法,仅在节点实际发生变化时进行调谐。
这减少了对基础设施提供商的不必要 API 调用,降低了速率限制 API 的压力,
并允许运维人员更高效地使用其可用配额。
要对此进行 A/B 测试,请比较特性门控禁用(默认)与启用时的 route_controller_route_sync_total。
在节点变化不频繁的集群中,开启特性门控后,你应该会看到同步速率显著下降。
示例:预期行为
特性门控禁用时(默认的固定间隔循环),无论是否发生任何节点变化,计数器都会稳定递增:
# After 10 minutes with no node changes
route_controller_route_sync_total 60
# After 20 minutes, still no node changes
route_controller_route_sync_total 120
特性门控启用时(基于监视的调和),仅在节点实际被添加、移除或更新时,计数器才会递增:
# After 10 minutes with no node changes
route_controller_route_sync_total 1
# After 20 minutes, still no node changes — counter unchanged
route_controller_route_sync_total 1
# A new node joins the cluster — counter increments
route_controller_route_sync_total 2
这种差异在节点很少变化的稳定集群中尤其明显。
我在哪里可以提供反馈?
如果你有反馈,欢迎通过以下任一渠道联系我们:
- Kubernetes Slack 上的 #sig-cloud-provider 频道
- GitHub 上的 KEP-5237 Issue
- SIG Cloud Provider 社区页面了解其他沟通渠道
我如何了解更多?
有关更多详细信息,请参阅 KEP-5237。