当 Kubernetes 集群运行在云平台内部时,Cloud Provider 使得 Kubernetes 可以直接利用云平台实现持久化卷、负载均衡、网络路由、DNS 解析以及横向扩展等功能。
Kubenretes 内置的 Cloud Provider 包括
- GCE
- AWS
- Azure
- Mesos
- OpenStack
- CloudStack
- Ovirt
- Photon
- Rackspace
- Vsphere
- apiserver,kubelet,controller-manager 都配置 cloud provider 选项
- Kubelet
- 通过 Cloud Provider 接口查询 nodename
- 向 API Server 注册 Node 时查询 InstanceID、ProviderID、ExternalID 和 Zone 等信息
- 定期查询 Node 是否新增了 IP 地址
- 设置无法调度的条件(condition),直到云服务商的路由配置完成
- kube-apiserver
- 向所有 Node 分发 SSH 密钥以便建立 SSH 隧道
- PersistentVolumeLabel 负责 PV 标签
- PersistentVolumeClainResize 动态扩展 PV 的大小
- kube-controller-manager
- Node 控制器检查 Node 所在 VM 的状态。当 VM 删除后自动从 API Server 中删除该 Node。
- Volume 控制器向云提供商创建和删除持久化存储卷,并按需要挂载或卸载到指定的 VM 上。
- Route 控制器给所有已注册的 Nodes 配置云路由。
- Service 控制器给 LoadBalancer 类型的服务创建负载均衡器并更新服务的外网 IP。
- Kubelet 必须配置
--cloud-provider=external`,并且 `kube-apiserver` 和 `kube-controller-manager` 必须不配置 cloud provider。 kube-apiserver的准入控制选项不能包含 PersistentVolumeLabel。cloud-controller-manager独立运行,并开启InitializerConifguration。- Kubelet 可以通过
provider-id选项配置ExternalID,启动后会自动给 Node 添加 taintnode.cloudprovider.kubernetes.io/uninitialized=NoSchedule。 cloud-controller-manager在收到 Node 注册的事件后再次初始化 Node 配置,添加 zone、类型等信息,并删除上一步 Kubelet 自动创建的 taint。- 主要逻辑(也就是合并了 kube-apiserver 和 kube-controller-manager 跟云相关的逻辑)
- Node 控制器检查 Node 所在 VM 的状态。当 VM 删除后自动从 API Server 中删除该 Node。
- Volume 控制器向云提供商创建和删除持久化存储卷,并按需要挂载或卸载到指定的 VM 上。
- Route 控制器给所有已注册的 Nodes 配置云路由。
- Service 控制器给 LoadBalancer 类型的服务创建负载均衡器并更新服务的外网 IP。
- PersistentVolumeLabel 准入控制负责 PV 标签
- PersistentVolumeClainResize 准入控制动态扩展 PV 大小
在集群启动过程中,cloud-controller-manager 会遇到"鸡生蛋蛋生鸡"的启动时序问题:
- 节点注册问题: kubelet 启动时向 API Server 注册 Node 对象,并添加
node.cloudprovider.kubernetes.io/uninitialized=NoScheduletaint - 调度依赖: cloud-controller-manager 负责移除该 taint 并添加云提供商特定信息(如节点地址、标签等)
- 启动时序矛盾: cloud-controller-manager 本身可能因为以下原因无法正常调度:
- 节点存在未初始化的 taint
- 节点处于 not-ready 状态
- 网络初始化依赖关系
spec:
hostNetwork: truetolerations:
- key: "node.cloudprovider.kubernetes.io/uninitialized"
operator: "Exists"
effect: "NoSchedule"
- key: "node-role.kubernetes.io/control-plane"
operator: "Exists"
effect: "NoSchedule"
- key: "node.kubernetes.io/not-ready"
operator: "Exists"
effect: "NoExecute"
tolerationSeconds: 300nodeSelector:
node-role.kubernetes.io/control-plane: ""推荐使用 Deployment 或 DaemonSet 而不是静态 Pod,以确保高可用性。
当运行多个副本时,启用 leader election:
--leader-elect=true
--leader-elect-lease-duration=15s
--leader-elect-renew-deadline=10s
--leader-elect-retry-period=2s防止多个控制器实例调度到同一主机:
affinity:
podAntiAffinity:
preferredDuringSchedulingIgnoredDuringExecution:
- weight: 100
podAffinityTerm:
labelSelector:
matchLabels:
component: cloud-controller-manager
topologyKey: kubernetes.io/hostnameapiVersion: apps/v1
kind: Deployment
metadata:
name: cloud-controller-manager
namespace: kube-system
spec:
replicas: 2
selector:
matchLabels:
component: cloud-controller-manager
template:
metadata:
labels:
component: cloud-controller-manager
spec:
hostNetwork: true
nodeSelector:
node-role.kubernetes.io/control-plane: ""
tolerations:
- key: "node.cloudprovider.kubernetes.io/uninitialized"
operator: "Exists"
effect: "NoSchedule"
- key: "node-role.kubernetes.io/control-plane"
operator: "Exists"
effect: "NoSchedule"
- key: "node.kubernetes.io/not-ready"
operator: "Exists"
effect: "NoExecute"
tolerationSeconds: 300
affinity:
podAntiAffinity:
preferredDuringSchedulingIgnoredDuringExecution:
- weight: 100
podAffinityTerm:
labelSelector:
matchLabels:
component: cloud-controller-manager
topologyKey: kubernetes.io/hostname
containers:
- name: cloud-controller-manager
image: your-cloud-provider/cloud-controller-manager:latest
command:
- /cloud-controller-manager
- --leader-elect=true
- --cloud-provider=your-provider
- --use-service-account-credentials=trueKubernetes 的 Cloud Provider 目前正在重构中
- v1.6 添加了独立的
cloud-controller-manager服务,云提供商可以构建自己的cloud-controller-manager而无须修改 Kubernetes 核心代码 - v1.7-v1.10 进一步重构
cloud-controller-manager,解耦了 Controller Manager 与 Cloud Controller 的代码逻辑 - v1.11 External Cloud Provider 升级为 Beta 版
构建一个新的云提供商的 Cloud Provider 步骤为
- 编写实现 cloudprovider.Interface 的 cloudprovider 代码
- 将该 cloudprovider 链接到
cloud-controller-manager- 在
cloud-controller-manager中导入新的 cloudprovider:import "pkg/new-cloud-provider" - 初始化时传入新 cloudprovider 的名字,如
cloudprovider.InitCloudProvider("rancher", s.CloudConfigFile)
- 在
- 配置 kube-controller-manager
--cloud-provider=external - 启动
cloud-controller-manager
具体实现方法可以参考 rancher-cloud-controller-manager 和 cloud-controller-manager。