Ir para o conteúdo principal
Documentação
Áreas de tecnologia
close
Soluções de IA, IA generativa e ML
Desenvolvimento de aplicativos
Hospedagem de aplicativos
Computação
Análise de dados e pipelines
Bancos de dados
Distribuído, híbrido e multicloud
Soluções por setor
Rede
Observabilidade e monitoramento
Segurança
Armazenamento
Ferramentas de vários produtos
close
Gerenciamento de recursos e acesso
SDK Cloud, linguagens, frameworks e ferramentas
Gerenciamento de custos e uso
Infraestrutura como código
Migração
Sites relacionados
close
Página inicial do Google Cloud
Teste e nível gratuitos
Central de arquitetura
Blog
Entrar em contato com a equipe de vendas
Centro para Desenvolvedores do Google Cloud
Centro para desenvolvedores do Google
Google Cloud Marketplace (no console)
Documentação do Google Cloud Marketplace
Google Cloud Ensina
Google Cloud Solution Center
Suporte do Google Cloud
Canal de tecnologia do Google Cloud no YouTube
/
English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어
Console
Fazer login
Google Kubernetes Engine (GKE)
Visão geral
Guias
Referência
Amostras
Recursos
Fale conosco
Comece gratuitamente
Documentação
Visão geral
Guias
Referência
Amostras
Recursos
Áreas de tecnologia
Mais
Ferramentas de vários produtos
Mais
Sites relacionados
Mais
Console
Fale conosco
Comece gratuitamente
Descoberta
Visão geral do GKE
Escolha um modo de operação do GKE
Edições do GKE
Como usar o GKE e o Cloud Run juntos
Casos de uso
Dados no GKE
Orquestração de IA/ML no GKE
Complementos para o GKE
Backup para GKE
Testar
Criar um cluster e implantar uma carga de trabalho
Conhecer o cluster e a carga de trabalho
Criar um cluster do GKE e implantar uma carga de trabalho usando o Terraform
Começar
Exemplos de fluxos de trabalho
Configurar um cluster e uma carga de trabalho para o preparo
Atualizar e implantar usando um ambiente de desenvolvimento integrado
Limpeza
Amostras
Princípios básicos
Playlist de vídeos: GKE Essentials
Playlist de vídeos: saiba mais sobre o Kubernetes com o Google
Quadrinho do Kubernetes
Kubernetes.io
Planejamento e preparo
Desenvolver e fornecer apps com o Cloud Code, Cloud Build e Google Cloud Deploy
Enfrentar desafios de entrega contínua
Configurar clusters do GKE
Planejar clusters para executar suas cargas de trabalho
Sobre as opções de configuração de clusters
Sobre a administração de clusters
Arquitetura do cluster do GKE
Sobre clusters regionais
Sobre os feature gates
Sobre os clusters Alfa
Configurar clusters do Autopilot
Sobre o Autopilot do GKE
Criar clusters do Autopilot
Estender o ambiente de execução dos pods do Autopilot
Configurar clusters padrão
Criar um cluster zonal
Criar um cluster regional
Criar cluster alfa
Criar um cluster usando os pools de nós do Windows Server
Preparar-se para usar clusters
Instalar o kubectl e configurar o acesso ao cluster
Usar rótulos para organizar clusters
Gerenciar recursos do GKE usando tags
Configurar pools de nós
Sobre imagens de nós
Sobre imagens em contêiner
Especificar uma imagem de nó
Sobre as cargas de trabalho do Arm no GKE
Criar clusters e pools de nós com nós do Arm
Planejar tamanhos de nós do GKE Standard
Sobre VMs do Spot
Usar nós de locatário individual
Sobre os contêineres do Windows Server
Nós de reparo automático
Inicializar automaticamente os nós do GKE com o DaemonSets.
Configurar clusters para multilocação
Sobre a multilocação de clusters
Planejar um ambiente multilocatário
Preparar clusters do GKE para locatários terceirizados
Configurar a geração de registros de multilocatário
Otimizar o uso de recursos com o provisionamento automático de nós
Criar frotas para simplificar o gerenciamento de vários clusters
Sobre as frotas
Criar frotas
Configurar malha de serviço
Provisionar o Anthos Service Mesh em um cluster do Autopilot
Melhore a escalonabilidade para clusters
Sobre a escalonabilidade do GKE
Planejar a escalonabilidade
Planeje clusters grandes do GKE
Planeje cargas de trabalho grandes
Provisionar capacidade de computação extra para escalonamento rápido de pods
Consumir recursos zonais reservados
Reduzir e otimizar custos
Planejar a otimização de custos
Conferir os custos do GKE
Ver detalhamento dos custos do cluster
Ver métricas de otimização relacionadas ao custo
Otimizar os custos do GKE
Dimensionar as cargas de trabalho do GKE em escala
Reduzir custos diminuindo os clusters do GKE fora do horário de pico
Estime seus custos do GKE no início do ciclo de desenvolvimento usando o GitHub
Estime seus custos do GKE no início do ciclo de desenvolvimento usando o GitLab
Identificar clusters inativos do GKE
Configurar o escalonamento automático para infraestrutura
Sobre o escalonamento automático de clusters
Configurar o escalonamento automático de cluster
Sobre o provisionamento automático de nós
Configurar o provisionamento automático de nós
Ver eventos de escalonamento automático do cluster
Configurar o escalonamento automático para cargas de trabalho
Como escalonar aplicativos implantados
Sobre o escalonamento automático de cargas de trabalho com base em métricas
Otimizar o escalonamento automático de pod com base em métricas
Sobre o escalonamento automático horizontal de pods
Escalonamento automático de implantações usando o escalonamento automático horizontal de pods
Sobre o escalonamento automático vertical de pods
Configurar o escalonamento automático multidimensional de pods
Escalonar solicitações e limites de recursos de contêiner
Configurar rede
Planejar sua infraestrutura de rede
Sobre a rede do GKE
Comparar modelos de rede
Práticas recomendadas para redes do GKE
Planejar endereços IP para clusters
Configurar VPC compartilhada
Sobre a VPC compartilhada
Configurar clusters para a VPC compartilhada
Configurar o Traffic Director com VPC compartilhada
Controlar e visualizar o roteamento de tráfego de pods
Sobre clusters nativos de VPC
Criar clusters nativos de VPC usando intervalos de IP do alias
Adicionar intervalos de endereços IP do pod
Configurar o máximo de pods por nó
Criar clusters baseados em rotas
Configurar a visibilidade intranós
Usar o mascaramento de IP
Sobre o mascaramento de IP
Configurar um agente de mascaramento de IP
Configurar mascaramento de IP em clusters do Autopilot
Ativar descoberta de serviços usando DNS
Usar kube-dns
Usar o NodeLocal DNSCache
Implantações personalizadas do kube-dns
Usar o Cloud DNS
Expor seus apps
Sobre os serviços
Sobre a rede de serviços
Expor apps como serviços
Configurar a rede para um cluster de produção básico
Expor aplicativos de malha de serviço
Como configurar nomes de domínio com endereços IP estáticos
Tráfego de balanceamento de carga
Usar o gateway para balanceamento de carga
Sobre o Gateway
Sobre o gerenciamento de tráfego do gateway
Sobre a segurança do gateway
Implantar recursos de gateway
Proteger um gateway
Configurar recursos de gateway usando políticas
Sobre os recursos da GatewayClass
Usar o recurso de entrada
Saiba mais sobre o Ingress do GKE para balanceadores de carga de aplicativo externos
Configurar um balanceador de carga de aplicativo externo com o Ingress
Ingress do Ingress para balanceadores de carga de aplicativo externos
Sobre o Ingress para balanceadores de carga internos de aplicativos
Como configurar a Entrada para balanceadores de carga internos do aplicativo
Sobre o balanceamento de nuvem nativo de contêiner
Usar o balanceamento de carga nativo de contêiner por meio da Entrada
Usar certificados SSL gerenciados pelo Google
Usar vários certificados SSL
Use o HTTP/2
Usar um controlador de Entrada personalizado
Usar serviços
Sobre os serviços LoadBalancer
criar um balanceador de carga interno
Criar um balanceador de carga interno em redes VPC
Criar um balanceador de carga externo baseado em serviço de back-end
Criar um serviço usando NEGs zonais independentes
Saiba mais sobre o parâmetro de serviço LoadBalancer
Usar o Envoy Proxy para balancear a carga de serviços do gRPC
Confira as regras de firewall criadas automaticamente
Isolar os clusters
Sobre clusters privados
Criar clusters particulares
Configurações avançadas de cluster particular
Monitorar clusters particulares
Alterar isolamento de cluster
Controlar a comunicação entre pods e serviços usando políticas de rede
Configurar políticas de rede para aplicativos
Controlar o tráfego de saída do pod usando políticas de rede FQDN
Controlar a comunicação em todo o cluster usando políticas de rede
Sobre o Dataplane V2
Ativar o Dataplane V2
Usar a geração de registros da política de rede
Proteger serviços do Kubernetes com o Istio
Configurar redes de vários clusters
Sobre os serviços de vários clusters (MCS)
Sobre Ingress de vários clusters
Escolher a API de balanceamento de carga de vários clusters para o GKE
Migrar para uma rede de vários clusters
Planejar upgrades em um ambiente com vários clusters
Ativar gateways de vários clusters
Implantar gateways de vários clusters
Configurar a entrada de vários clusters
Implantar entrada em clusters
Como fazer upgrade de um ambiente do GKE de vários clusters com a entrada de vários clusters (MCI, na sigla em inglês)
Configurar serviços de vários clusters
Como configurar serviços de vários clusters com a VPC compartilhada
Melhorar o desempenho da rede
Aumentar a velocidade do tráfego de rede para nós da GPU
Aumentar a largura de banda da rede para os nós de cluster
Maximizar a largura de banda da rede GPU com o GPUDirect-TCPX e o recurso de várias redes
Otimizar suas funções de rede
Sobre o suporte a várias redes para pods
Configurar o suporte a várias redes para pods
Observar o tráfego do Kubernetes
Sobre a observabilidade do GKE Dataplane V2
Configurar a observabilidade do GKE Dataplane V2
Observar o tráfego usando a observabilidade do GKE Dataplane V2
Provisionar armazenamento
Sobre o armazenamento de clusters do GKE
Como usar primitivas e abstrações do Kubernetes
Como usar volumes permanentes e provisionamento dinâmico
Como usar StatefulSets
Sobre snapshots de volume
Como usar a expansão de volume
Armazenamento em blocos
Provisionar e usar discos permanentes
Como usar o driver CSI do disco permanente do Compute Engine
Como usar discos permanentes preexistentes
Instalar manualmente um driver CSI
Como usar discos permanentes com vários leitores (ReadOnlyMany)
Aumentar a disponibilidade do app com estado usando o operador de alta disponibilidade com estado
Provisionar e usar o Hiperdisco
Sobre o Hiperdisco
Escalonar o desempenho do armazenamento usando o Hiperdisco
Gerenciar seu armazenamento permanente
Configurar um disco de inicialização para sistemas de arquivos de nós
Clonar discos permanentes
Fazer backup e restaurar o armazenamento do Persistent Disk usando snapshots de volume
Acessar volumes SMB em nós do Windows Server
Otimizar o desempenho do disco
Sobre a otimização do desempenho do disco
Discos permanentes com SSD
Discos permanentes regionais
Monitorar o desempenho do disco
SSD local e armazenamento temporário
Sobre o armazenamento SSD local para GKE
Provisionar armazenamento temporário com SSD local
Provisionar armazenamento em blocos bruto com suporte de SSD local
Criar uma implantação usando um volume EmptyDir
Usar discos permanentes dedicados como volumes temporários
Armazenamento de arquivo
Sobre o suporte do Filestore para o GKE
Acessar instâncias do Filestore
Implantar uma carga de trabalho com estado usando o Filestore
Sobre o compartilhamento múltiplo do Filestore para o GKE
Otimizar compartilhamentos múltiplos para o GKE
Fazer backup e restaurar o armazenamento do Filestore usando snapshots de volume.
Armazenamento de objetos
Acessar buckets do Cloud Storage com o driver FUSE CSI do Cloud Storage
Criptografar o armazenamento permanente usando CMEK
Configurar a segurança do cluster
Planejar a segurança do cluster
Sobre a segurança no GKE
Aumentar a proteção dos seus clusters
Patches de segurança
Medidas de segurança no Autopilot do GKE
Sobre a segurança do plano de controle
Sobre os registros de auditoria
Sobre a política de auditoria
Responsabilidades de segurança compartilhadas
Sobre a confiança do cluster
Reduzir os incidentes de segurança
vTPM em cargas de trabalho confidenciais do GKE
Autenticar e autorizar
Autenticar na API GKE
Autenticar as APIs do Google Cloud no GKE
Sobre o RBAC e o IAM
Práticas recomendadas para RBAC
Sobre as contas de serviço no GKE
Autenticar no servidor da API Kubernetes
Usar provedores de identidade externos para autenticar nos clusters do GKE
Autorizar ações em clusters usando o RBAC do GKE
Gerenciar permissões de grupos usando o Grupos do Google com o RBAC
Autorizar o acesso aos recursos do Google Cloud usando políticas do IAM
Gerenciar o acesso SSH de nós sem usar chaves SSH
Ativar acesso e visualização de recursos do cluster por namespace
Restringir ações em recursos do GKE usando políticas personalizadas da organização
Sobre o seccomp no GKE
Escopos de acesso no GKE
Acessar registros particulares com certificados de AC particulares
Isolar os clusters e as cargas de trabalho
Adicionar redes autorizadas para acesso ao plano de controle
Alterar isolamento de cluster
Sobre o GKE Sandbox
Isolar as cargas de trabalho usando o GKE Sandbox
Isolar as cargas de trabalho em pools de nós dedicados
Acessar remotamente um cluster particular usando um Bastion Host
Aplicar regras e políticas de firewall
Aplicar seletivamente políticas de firewall no GKE
Usar tags de rede para aplicar regras de firewall a nós
Aumentar a proteção de cargas de trabalho e nós
Aplicar políticas de segurança predefinidas no nível do pod usando o PodSecurity
Aplicar políticas de segurança personalizadas no nível do pod usando o Gatekeeper
Sobre a federação de identidade da carga de trabalho para o GKE
Autenticar as APIs do Google Cloud no GKE
Acessar secrets armazenados fora dos clusters do GKE usando bibliotecas de cliente
Desativar a porta somente leitura do kubelet não segura
Criptografar dados sensíveis
Criptografar seus dados em uso com os nós confidenciais do GKE
Criptografe dados em trânsito no GKE com chaves de criptografia gerenciadas pelo usuário
Criptografar secrets na camada do aplicativo
Resolver problemas de secrets da camada do aplicativo
Gerenciar credenciais
Alternar as credenciais do cluster
Alternar os endereços IP do plano de controle
Monitorar a segurança do cluster
Sobre o painel de postura de segurança
Sobre a verificação da postura de segurança do Kubernetes
Verificar cargas de trabalho para problemas de configuração
Sobre a verificação de vulnerabilidades da carga de trabalho
Verificar contêineres em busca de vulnerabilidades conhecidas
Monitorar a segurança da frota
Configurar recursos de postura de segurança do GKE para frotas
Sobre a detecção de ameaças do GKE
Encontrar ameaças em clusters usando o GKE Threat Detection
Ativar a geração de registros auditd do Linux em clusters do Standard
Implantar e gerenciar cargas de trabalho
Planejar implantações de carga de trabalho
Sobre a implantação de cargas de trabalho no GKE
Planejar solicitações de recursos para cargas de trabalho do Autopilot
Migrar cargas de trabalho
Migrar cargas de trabalho para o GKE
Identificar clusters do Standard para migração para o Autopilot
Preparar a migração para clusters do Autopilot de clusters padrão
Implantar cargas de trabalho com requisitos de computação especializados
Sobre as classes de computação no Autopilot
Escolher classes de computação para pods do Autopilot
Plataformas mínimas de CPU para cargas de trabalho com uso intensivo de computação
Configurar o bursting de pods no GKE
Gerenciar cargas de trabalho
Configurar a separação de cargas de trabalho no GKE
Controlar a programação com taints de nó
Colocar pods do GKE em zonas específicas
Simular falha de zona
Fazer atualizações graduais
Melhorar a eficiência da carga de trabalho usando o Fast Socket NCCL
Sobre os resumos da imagem de contêiner
Como usar resumos de imagem de contêiner em manifestos do Kubernetes
Melhore a velocidade de inicialização da carga de trabalho
Usar imagens de contêiner de streaming
Usar discos de inicialização secundários para pré-carregar dados ou imagens de contêiner
Integração e entrega contínuas
Configurar implantações automatizadas
Planejar a criação de contêineres
Plano para contêineres operacionais
Planejar a integração e entrega contínuas
Criar um pipeline de CI/CD com o Azure Pipelines
Entrega contínua no estilo GitOps com o Cloud Build
Implementar a autorização binária usando o Cloud Build
CI/CD modernas com o GKE
Um framework de entrega de software
Criar um sistema de CI/CD
Aplicar o fluxo de trabalho do desenvolvedor
Implantar bancos de dados, caches e cargas de trabalho de streaming de dados
Planejar suas implantações de banco de dados no GKE
Bancos de dados gerenciados
Implantar um app usando o Autopilot do GKE e o Spanner
Implantar o WordPress no GKE com Persistent Disk e o Cloud SQL
Kafka
Implantar o Apache Kafka no GKE usando o Strimzi
Implantar o Apache Kafka no GKE usando o Confluent
Implantar um cluster Kafka altamente disponível no GKE
Redis
Criar um web app de várias camadas com Redis e PHP
Implantar um cluster do Redis no GKE
Usar o MemoryStore para Redis como um ranking em jogos
Implantar o Redis no GKE usando o Spotahome
Implantar o Redis no GKE usando o Redis Enterprise
MySQL
Implantar um cluster do MySQL com estado
PostgreSQL
Implantar um banco de dados do PostgreSQL altamente disponível
Implantar o PostgreSQL no GKE usando o Zalando
Implantar o PostgreSQL no GKE usando o CloudNativePG
SQL Server
Implantar uma instância única do SQL Server 2017 no GKE
Memcached
Implantar o Memcached no GKE
Bancos de dados vetoriais
Implantar um banco de dados Qdrant no GKE
Implantar um banco de dados do Elasticsearch no GKE
Implantar um banco de dados de vetores PostgreSQL no GKE
Implantar cargas de trabalho de IA/ML
Executar cargas de trabalho de ML e IA
GPUs
Sobre GPUs no GKE
Implantar cargas de trabalho da GPU no Autopilot do GKE
Implantar cargas de trabalho da GPU no GKE Standard
Compartilhamento de GPU
Sobre as estratégias de compartilhamento de GPU no GKE
Usar GPU de várias instâncias
Usar o compartilhamento de tempo da GPU
Usar MPS da NVIDIA
TPUs no GKE
Sobre TPUs no GKE
Implantar cargas de trabalho de TPU no Autopilot do GKE
Implantar cargas de trabalho de TPU no GKE Standard
Implantar Multislices de TPU no GKE
Orquestrar cargas de trabalho do TPU Multislice usando o JobSet e Kueue
Cargas de trabalho baseadas em CPU
Execute cargas de trabalho com uso intensivo de CPU em nós com desempenho otimizado
Treinamento
Treinar um modelo com GPUs no modo do GKE Standard
Inferência
GPUs
Disponibilizar um modelo com uma única GPU
Exibir um LLM com várias GPUs
Exibir um LLM em GPUs L4 com Ray
Disponibilizar LLMs escalonáveis usando o TorchServe
Disponibilizar o Gemma em GPUs com o TGI Hugging Face
Disponibilizar o Gemma em GPUs com o vLLM
Disponibilizar o Gemma em GPUs com o TensorRT-LLM
TPUs
Exibição do Gemma em TPUs com o JetStream
Disponibilizar o Gemma em TPUs com o Saxml
Disponibilizar um LLM usando TPUs de vários hosts com o Saxml
Em lote
Práticas recomendadas para executar cargas de trabalho em lote no GKE
Implantar um sistema em lote usando o Kueue
Implantar GPUs para cargas de trabalho em lote com o ProvisioningRequest
Implantar cargas de trabalho por tipo de aplicativo
Servidores e aplicativos da Web
Plano de exibição de sites
Implantar um app com estado
Garanta cargas de trabalho com estado prontas para interrupção
Implantar um app sem estado
Permitir conexões diretas com pods do Autopilot usando hostPort
Processamento de imagens usando microsserviços e mensagens assíncronas
Executar Django
Implantar um aplicativo do Cloud Marketplace
Execute cargas de trabalho de pilha completa em grande escala no GKE
Implantar um app de servidor da Web conteinerizado
Jogos
Isolar o controlador do Agones no cluster do GKE
Implantar cargas de trabalho do Arm
Preparar uma carga de trabalho do Arm para implantação em clusters padrão