首页 > 帮助中心 > Google Cloud GKE 如何配置自动伸缩，应对流量高峰？

Google Cloud GKE 如何配置自动伸缩，应对流量高峰？

⏱️2026-03-24 09:00 👁️60

🎉 Google Cloud GKE 自动伸缩配置指南 (应对流量高峰) 🎉

🤔 为什么需要自动伸缩?

流量就像过山车🎢，时高时低。自动伸缩就像一个聪明的管家，当流量增加时，自动增加资源，流量减少时，自动缩减资源，确保你的应用始终保持最佳状态💪！

⚙️ GKE 自动伸缩的两种方式

GKE 提供了两种自动伸缩的方式：

Pod 水平自动伸缩 (Horizontal Pod Autoscaling, HPA): 针对 Deployment 或 ReplicaSet 中的 Pod 数量进行伸缩。它会监控 Pod 的 CPU 利用率、内存利用率或自定义指标，并根据这些指标自动调整 Pod 的副本数。
集群自动伸缩 (Cluster Autoscaler): 针对集群中的节点数量进行伸缩。当集群中没有足够的资源来调度新的 Pod 时，它会自动增加节点。当节点利用率较低时，它会自动删除节点。

🚀 HPA 配置步骤

让我们先来看看如何配置 HPA：

1. 确定你的 Deployment 或 ReplicaSet

首先，你需要确定你想要进行自动伸缩的 Deployment 或 ReplicaSet。假设我们有一个名为 my-app 的 Deployment。

2. 部署 Metrics Server

HPA 需要 Metrics Server 来获取 Pod 的资源使用情况。如果你的集群还没有部署 Metrics Server，你需要先部署它。可以通过以下命令部署：

kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml

部署完成后，可以通过以下命令检查 Metrics Server 是否正常运行：

kubectl get deployment metrics-server -n kube-system

3. 创建 HPA

使用 kubectl autoscale 命令创建 HPA。例如，以下命令会创建一个名为 my-app-hpa 的 HPA，它会根据 CPU 利用率自动调整 my-app Deployment 的副本数。

kubectl autoscale deployment my-app --cpu-percent=50 --min=1 --max=10

这个命令的含义是：

deployment my-app: 指定要伸缩的 Deployment 名称。
--cpu-percent=50: 指定目标 CPU 利用率为 50%。当 Pod 的平均 CPU 利用率超过 50% 时，HPA 会增加 Pod 的副本数。
--min=1: 指定最小副本数为 1。
--max=10: 指定最大副本数为 10。

4. 验证 HPA

可以使用 kubectl get hpa 命令查看 HPA 的状态。

kubectl get hpa my-app-hpa

如果一切正常，你应该能够看到 HPA 的当前状态，包括目标 CPU 利用率和当前副本数。

5. 使用 YAML 文件创建 HPA (可选)

你也可以使用 YAML 文件来创建 HPA。以下是一个示例 YAML 文件：

apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: my-app-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: my-app
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 50

保存为 hpa.yaml 文件，然后使用以下命令创建 HPA：

kubectl apply -f hpa.yaml

☁️ 集群自动伸缩配置步骤

接下来，我们看看如何配置集群自动伸缩。这需要你在创建 GKE 集群时启用自动伸缩功能，或者在现有集群上启用。

1. 创建 GKE 集群时启用自动伸缩

在创建 GKE 集群时，你可以使用 gcloud 命令行工具启用自动伸缩功能。例如：

gcloud container clusters create my-cluster \
    --num-nodes=1 \
    --enable-autoscaling \
    --min-nodes=1 \
    --max-nodes=5 \
    --machine-type=e2-medium \
    --region=us-central1

这个命令的含义是：

--num-nodes=1: 指定初始节点数为 1。
--enable-autoscaling: 启用自动伸缩功能。
--min-nodes=1: 指定最小节点数为 1。
--max-nodes=5: 指定最大节点数为 5。
--machine-type=e2-medium: 指定节点使用的机器类型。

2. 在现有集群上启用自动伸缩

如果你的集群已经存在，你可以使用 gcloud container node-pools update 命令启用自动伸缩功能。首先，你需要找到你的节点池的名称。可以使用以下命令列出节点池：

gcloud container node-pools list --cluster=my-cluster --region=us-central1

假设你的节点池名称为 default-pool，那么你可以使用以下命令启用自动伸缩：

gcloud container node-pools update default-pool \
    --cluster=my-cluster \
    --region=us-central1 \
    --enable-autoscaling \
    --min-nodes=1 \
    --max-nodes=5

3. 验证集群自动伸缩

可以通过查看集群的事件来验证集群自动伸缩是否正常工作。

kubectl get events --watch

当集群自动伸缩时，你应该能够看到相关的事件，例如节点添加或删除。

💡 最佳实践

合理设置资源请求和限制: 确保你的 Pod 已经设置了合理的资源请求 (requests) 和限制 (limits)。这有助于 HPA 和集群自动伸缩做出更准确的决策。
监控你的应用: 使用 Prometheus、Grafana 等监控工具监控你的应用的性能指标，以便及时发现问题并进行调整。
测试自动伸缩: 在生产环境中启用自动伸缩之前，务必在测试环境中进行充分的测试，以确保其能够正常工作。
考虑使用自定义指标: 除了 CPU 和内存利用率，你还可以使用自定义指标来驱动 HPA。例如，你可以使用请求速率、队列长度等指标。

🎉 总结

通过配置 GKE 的 HPA 和集群自动伸缩，你可以轻松应对流量高峰，确保你的应用始终保持高性能和高可用性。希望这篇指南对你有所帮助！👍

上一篇： AWS Redshift如何进行数据建模，以优化查询性能？

下一篇：腾讯云私有网络如何配置NAT网关，以实现内网服务器访问公网？

国际云自助站点

我们提供一站式多云服务管理平台，支持阿里云国际、腾讯云国际、AWS（亚马逊云）和GCP（谷歌云）等主流国际云厂商。无论是新账户申请、余额充值，还是日常管理与监控，平台均可统一操作，大幅提升管理效率。同时支持余额预警、异常通知等推送功能，帮助用户实时掌握各云平台资源状态，防止因欠费导致业务中断。平台还支持多账号集中管理，适用于个人站长、跨境电商、开发团队等多场景使用需求，真正实现高效、安全、灵活的多云资源协同管理。

自助站点

自助BOT