Ir para o conteúdo principal
Google Cloud
Documentação Áreas de tecnologia
  • IA e AA
  • Desenvolvimento de aplicações
  • Alojamento de aplicações
  • Computação
  • Estatísticas e pipelines de dados
  • Bases de dados
  • Distribuído, híbrido e multinuvem
  • IA generativa
  • Soluções para setores
  • Trabalhar em rede
  • Observabilidade e monitorização
  • Segurança
  • Storage
Ferramentas em vários produtos
  • Gestão de acesso e recursos
  • Gestão de custos e utilização
  • SDK Cloud da Google, linguagens, frameworks e ferramentas
  • Infraestrutura como código
  • Migração
Sites relacionados
  • Google Cloud Home
  • Avaliação gratuita e nível gratuito
  • Architecture Center
  • Blogue
  • Contactar equipa de vendas
  • Google Cloud Developer Center
  • Google Developer Center
  • Google Cloud Marketplace
  • Documentação do Google Cloud Marketplace
  • Melhoria de competências do Google Cloud
  • Google Cloud Solution Center
  • Apoio técnico do Google Cloud
  • Canal do YouTube do Google Cloud Tech
/
  • English
  • Deutsch
  • Español
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어
Console Fazer login
  • Cloud Run
Guias Referência Amostras Recursos
Contacte-nos Começar gratuitamente
Google Cloud
  • Documentação
    • Guias
    • Referência
    • Amostras
    • Recursos
  • Áreas de tecnologia
    • Mais
  • Ferramentas em vários produtos
    • Mais
  • Sites relacionados
    • Mais
  • Console
  • Contacte-nos
  • Começar gratuitamente
  • Descubra
  • Vista geral do produto
  • Modelo de recursos do Cloud Run
  • Contrato de tempo de execução de contentores
  • A minha app é adequada para um serviço do Cloud Run?
  • Quando devo implementar uma função?
  • Começar
  • Vista geral
  • Implemente um serviço Web de exemplo
    • Implemente um contentor de amostra
    • Crie um repositório de modelos e implemente a partir de um repositório Git
    • Implemente um serviço Hello World a partir do código-fonte
      • Go
      • Node.js
      • Python
        • Frasco
        • FastAPI
        • Gradio
        • Streamlit
      • Java
      • Kotlin
      • C#
      • C++
      • PHP
      • Ruby
      • Outro
      • Frameworks
        • Vista geral
        • SSR do Angular
        • Next.js
        • Nuxt.js
        • SvelteKit
  • Implemente um contentor de grupo de trabalhadores de exemplo
  • Execute uma tarefa de exemplo
    • Executar uma tarefa
    • Execute uma tarefa a partir do código-fonte
      • Go
      • Node.js
      • Python
      • Java
      • Shell
  • Implemente uma função de exemplo
    • Implemente uma função através da consola
    • Implemente uma função através do gcloud
  • Programar
  • Configure o seu ambiente
  • Planeie e prepare o seu serviço
    • Desenvolva o seu serviço
    • Coloque o seu código em contentores
    • Ligue-se aos serviços Google Cloud
    • Instale um pacote do sistema no seu contentor
    • Execute comandos gcloud no seu contentor
  • Agentes de IA
    • Alojamento de agentes de IA
    • Alojamento de agentes A2A
      • Vista geral dos agentes A2A de anfitriões
      • Implemente um agente A2A
      • Teste e monitorize a implementação de agentes A2A
  • Servidores MCP
    • Servidores MCP do anfitrião
    • Crie e implemente um servidor MCP remoto
  • Planeie e prepare a sua função
    • Vista geral
    • Compare as funções do Cloud Run
    • Funções de escrita
      • Vista geral
      • Funções HTTP
      • Funções orientadas por eventos
    • Tempos de execução
      • Vista geral
      • Node.js
        • Vista geral
        • Dependências do Node.js
      • Python
        • Vista geral
        • Dependências do Python
      • Go
        • Vista geral
        • Dependências do Go
      • Java
        • Vista geral
        • Dependências Java
      • .NET
      • Ruby
      • PHP
    • Desenvolvimento de funções locais
    • Acionadores de funções
    • Tutoriais
      • Crie uma função que devolva resultados do BigQuery
      • Crie uma função que devolva resultados do Spanner
      • Integre com bases de dados do Cloud
      • Codelabs
  • Crie e teste
    • Crie origens para contentores
    • Crie funções para contentores
    • Testes locais
  • Publicar pedidos HTTP
  • Implemente serviços
    • Implemente imagens de contentores
    • Implementação contínua a partir do Git
    • Implemente a partir do código-fonte
    • Implemente funções
  • Servir tráfego Web
    • Mapeamento de domínios personalizados
    • Publicar recursos estáticos com a RFC
    • Servir tráfego de várias regiões
    • Ative a afinidade de sessão
    • Encaminhamento de proxy de front-end com o Nginx
  • Faça a gestão dos serviços
    • Veja, copie ou elimine serviços
    • Veja ou elimine revisões
    • Migração de tráfego, implementações graduais e reversões
  • Configure serviços
    • Vista geral
    • Capacidade
      • Limites de memória
      • Limites de CPU
      • GPU
        • Configuração da GPU
        • Práticas recomendadas de desempenho da GPU
        • Execute a inferência de MDIs em GPUs do Cloud Run com o Ollama
        • Execute modelos Gemma 3 no Cloud Run
        • Execute a inferência de MDIs em GPUs do Cloud Run com o vLLM
        • Execute o OpenCV no Cloud Run com aceleração por GPU
        • Execute a inferência de MDIs/CEs em GPUs do Cloud Run com o Hugging Face Transformers.js
        • Execute a inferência de MDIs em GPUs do Cloud Run com o TGI do Hugging Face
      • Tempo limite de pedido
      • Máximo de pedidos simultâneos
        • Acerca do número máximo de pedidos simultâneos por instância
        • Configure o número máximo de pedidos simultâneos
      • Faturação
      • Otimize as configurações do serviço com o Recomendador
    • Ambiente
      • Porta e ponto de entrada do contentor
      • Variáveis de ambiente
      • Suportes de volume
        • Volumes do Cloud Storage
        • Volumes NFS
        • Volumes na memória
      • Ambiente de execução
        • Vista geral
        • Selecione um ambiente de execução
      • Verificações de funcionamento do contentor
      • Pedidos HTTP/2
      • Secrets
      • Identidade do serviço
    • Dimensionar
      • Acerca do dimensionamento automático de instâncias para serviços
      • Máximo de instâncias
        • Acerca do número máximo de instâncias para serviços
        • Configure o número máximo de instâncias
      • Instâncias mínimas
      • Escala manual
    • Metadados
      • Descrição
      • Etiquetas
      • Etiquetas
    • Configurações de implementação de origem
      • Tempos de execução e imagens base de idiomas suportados
      • Configure as atualizações automáticas de imagens base
      • Variáveis de ambiente de compilação
      • Crie uma conta de serviço
      • Crie grupos de trabalhadores
  • Invocar e acionar serviços
    • Invocar com pedidos HTTPS
    • Aloje um destino de webhook
    • Fazer stream com WebSockets
      • Vista geral
      • Tutorial de criação de um serviço de chat WebSocket
    • Invocar de forma assíncrona
      • Invocar serviços com base numa programação
      • Crie um fluxo de trabalho
        • Invocar serviços como parte de um fluxo de trabalho
        • Ligue uma série de serviços do tutorial do Cloud Functions e do Cloud Run
      • Executar tarefas assíncronas
      • Chame um serviço a partir de uma subscrição push do Pub/Sub
        • Acione o serviço a partir do Pub/Sub
        • Integre o processamento de imagens no tutorial de exemplo do Pub/Sub
    • Acionador a partir de eventos
      • Crie acionadores com o Eventarc
      • Acionadores do Pub/Sub
        • Crie acionadores do EventArc do Pub/Sub
        • Acione funções a partir do Pub/Sub com o Eventarc
        • Acione funções a partir de entradas de registo encaminhadas
      • Acionadores do Cloud Storage