Ir al contenido principal
Google Cloud
Documentación Áreas tecnológicas
  • IA y aprendizaje automático
  • Desarrollo de aplicaciones
  • Alojamiento de aplicaciones
  • Computación
  • Analíticas y flujos de datos
  • Bases de datos
  • Tecnologías distribuidas, híbridas y multinube
  • IA generativa
  • Soluciones para sectores especializados
  • Redes
  • Observabilidad y monitorización
  • Seguridad
  • Storage
Herramientas entre productos
  • Gestión de accesos y recursos
  • Gestión de costes y uso
  • SDKs, lenguajes, frameworks y herramientas de Google Cloud
  • Infraestructura como código
  • Migración
Sitios relacionados
  • Página principal de Google Cloud
  • Prueba gratuita y nivel gratuito
  • Centro de arquitectura
  • Blog
  • Contactar con Ventas
  • Centro para Desarrolladores de Google Cloud
  • Centro para Desarrolladores de Google
  • Google Cloud Marketplace
  • Documentación de Google Cloud Marketplace
  • Google Cloud Skills Boost
  • Google Cloud Solution Center
  • El equipo de Asistencia de Google Cloud
  • Canal de YouTube de Google Cloud Tech
/
  • English
  • Deutsch
  • Español
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어
Consola Acceder
  • Cloud Run
Guías Referencia Ejemplos Recursos
Contacto Empezar gratis
Google Cloud
  • Documentación
    • Guías
    • Referencia
    • Ejemplos
    • Recursos
  • Áreas tecnológicas
    • Más
  • Herramientas entre productos
    • Más
  • Sitios relacionados
    • Más
  • Consola
  • Contacto
  • Empezar gratis
  • Descubrir
  • Descripción general del producto
  • Modelo de recursos de Cloud Run
  • Contrato de entorno de ejecución de contenedor
  • ¿Mi aplicación es adecuada para un servicio de Cloud Run?
  • ¿Cuándo debo implementar una función?
  • Empezar
  • Introducción
  • Desplegar un servicio web de ejemplo
    • Desplegar un contenedor de muestra
    • Crear un repositorio de plantillas y desplegarlo desde un repositorio de Git
    • Desplegar un servicio Hello World desde el código fuente
      • Go
      • Node.js
      • Python
        • Flask
        • FastAPI
        • Gradio
        • Streamlit
      • Java
      • Kotlin
      • C#
      • C++
      • PHP
      • Ruby
      • Otras
      • Frameworks
        • Introducción
        • SSR de Angular
        • Next.js
        • Nuxt.js
        • SvelteKit
  • Desplegar un contenedor de grupo de trabajadores de ejemplo
  • Ejecutar una tarea de ejemplo
    • Ejecutar una tarea
    • Ejecutar un trabajo a partir del código fuente
      • Go
      • Node.js
      • Python
      • Java
      • Shell
  • Desplegar una función de ejemplo
    • Desplegar una función con la consola
    • Desplegar una función con gcloud
  • Desarrollar
  • Configurar un entorno
  • Planificar y preparar el servicio
    • Desarrollar un servicio
    • Insertar el código en contenedores
    • Conectarse a los servicios de Google Cloud
    • Instalar un paquete del sistema en un contenedor
    • Ejecutar comandos de gcloud en tu contenedor
  • Agentes de IA
    • Alojar agentes de IA
    • Alojar agentes A2A
      • Información general sobre los agentes A2A de host
      • Desplegar un agente A2A
      • Probar y monitorizar el despliegue de agentes A2A
  • Servidores de MCP
    • Alojar servidores de MCP
    • Crear y desplegar un servidor de MCP remoto
  • Planifica y prepara tu función
    • Introducción
    • Comparar Cloud Run Functions
    • Escribir funciones
      • Introducción
      • Funciones HTTP
      • Funciones basadas en eventos
    • Tiempos de ejecución
      • Introducción
      • Node.js
        • Introducción
        • Dependencias de Node.js
      • Python
        • Introducción
        • Dependencias de Python
      • Go
        • Introducción
        • Dependencias de Go
      • Java
        • Introducción
        • Dependencias de Java
      • .NET
      • Ruby
      • PHP
    • Desarrollo de funciones locales
    • Activadores de funciones
    • Tutoriales
      • Crear una función que devuelva resultados de BigQuery
      • Crear una función que devuelva resultados de Spanner
      • Integración con bases de datos de Cloud
      • Codelabs
  • Compilar y probar
    • Crear fuentes para contenedores
    • Crear funciones en contenedores
    • Pruebas locales
  • Servir solicitudes HTTP
  • Desplegar servicios
    • Desplegar imágenes de contenedor
    • Despliegue continuo desde git
    • Desplegar desde el código fuente
    • Desplegar funciones
  • Servir tráfico web
    • Asignar dominios personalizados
    • Servir recursos estáticos con Cloud CDN
    • Servir tráfico procedente de varias regiones
    • Habilitar la afinidad de sesión
    • Proxy frontend con Nginx
  • Gestionar servicios
    • Ver, copiar o eliminar servicios
    • Ver o eliminar revisiones
    • Migración de tráfico, lanzamientos graduales y restauraciones
  • Configurar servicios
    • Introducción
    • Capacidad
      • Límites de memoria
      • Límites de CPU
      • GPU
        • Configuración de GPU
        • Prácticas recomendadas para mejorar el rendimiento de la GPU
        • Ejecutar la inferencia de LLMs en GPUs de Cloud Run con Ollama
        • Ejecutar modelos de Gemma 3 en Cloud Run
        • Ejecutar la inferencia de LLMs en GPUs de Cloud Run con vLLM
        • Ejecutar OpenCV en Cloud Run con aceleración de GPU
        • Ejecutar la inferencia de LLM en GPUs de Cloud Run con Hugging Face Transformers.js
        • Ejecutar la inferencia de LLMs en GPUs de Cloud Run con Hugging Face TGI
      • Tiempo de espera de solicitud agotado
      • Número máximo de solicitudes simultáneas
        • Acerca del número máximo de solicitudes simultáneas por instancia
        • Configurar el número máximo de solicitudes simultáneas
      • Facturación
      • Optimizar las configuraciones de servicios con el recomendador
    • Entorno
      • Puerto y punto de entrada del contenedor
      • Variables de entorno
      • Montajes del volumen
        • Volúmenes de Cloud Storage
        • Volúmenes NFS
        • Volúmenes en memoria
      • Entorno de ejecución
        • Introducción
        • Seleccionar un entorno de ejecución
      • Comprobaciones del estado de los contenedores
      • Solicitudes HTTP/2
      • Secretos
      • Identidad de servicio
    • Escalado
      • Información sobre el autoescalado de instancias para servicios
      • Número máximo de instancias
        • Acerca del número máximo de instancias de los servicios
        • Configurar el número máximo de instancias
      • Número mínimo de instancias
      • Escalado manual
    • Metadatos
      • Descripción
      • Etiquetas
      • Etiquetas
    • Configuraciones de implementación de origen
      • Runtimes e imágenes base de los idiomas admitidos
      • Configurar actualizaciones automáticas de la imagen base
      • Variables de entorno de desarrollo
      • Cuenta de servicio de compilación
      • Grupos de trabajadores de Cloud Build
  • Invocar y activar servicios
    • Invocar con solicitudes HTTPS
    • Alojar un destino webhook
    • Streaming con WebSockets
      • Introducción
      • Tutorial para crear un servicio de chat de WebSocket
    • Invocar de forma asíncrona
      • Invocar servicios según una programación
      • Crear un flujo de trabajo
        • Invocar servicios como parte de un flujo de trabajo
        • Conectar una serie de servicios desde Cloud Functions y Cloud Run
      • Ejecutar tareas asíncronas
      • Llamar a un servicio desde una suscripción de inserción de Pub/Sub
        • Activar un servicio desde Pub/Sub
        • Integrar el procesamiento de imágenes en el tutorial de ejemplo de Pub/Sub
    • Activadores de eventos
      • Crear activadores con Eventarc
      • Activadores de Pub/Sub
        • Crear activadores de Eventarc de Pub/Sub
        • Activar funciones desde Pub/Sub mediante Eventarc
        • Activar funciones a partir de entradas de registro enrutadas
      • Activadores de Cloud Storage
        • Crear activadores con Cloud Storage
        • Activar servicios desde Cloud Storage con Eventarc
        • Activar funciones de Cloud Storage con Eventarc
      • Activadores de Firestore
        • Crear activadores con Firestore
        • Activar funciones a partir de eventos de una base de datos de Firestore
    • Conectarse con otros servicios mediante gRPC
  • Prácticas recomendadas
    • Consejos generales de desarrollo para servicios
    • Optimizar servicios Java
    • Optimizar servicios de Python
    • Optimizar servicios de Node.js
    • Prácticas recomendadas para las pruebas de carga
    • Información sobre la redundancia zonal
    • Prácticas recomendadas para las funciones
      • Introducción
      • Habilitar los reintentos de funciones basadas en eventos
  • Ejecutar tareas hasta su finalización
  • Crear tareas
  • Ejecutar tareas
    • Ejecutar tareas
    • Ejecutar tareas programadas
    • Ejecutar tareas programadas en un perímetro de los controles de servicio de VPC
    • Ejecutar tareas desde Workflows
  • Configurar tareas
    • Punto de entrada del contenedor
    • Límites de CPU
    • Límites de memoria
    • GPU
      • Configuración de GPU
      • Prácticas recomendadas para GPUs
      • Afinar LLMs con GPUs mediante tareas de Cloud Run
      • Ejecutar inferencia por lotes con GPUs mediante Cloud Run Jobs
    • Variables de entorno
    • Comprobaciones del estado de los contenedores
    • Montajes del volumen
      • Volúmenes de Cloud Storage
      • Volúmenes NFS
      • Volúmenes en memoria
      • Otros sistemas de archivos de red
    • Etiquetas
    • Número máximo de reintentos
    • Paralelismo
    • Secretos
    • Identidad de servicio
    • Tiempo de espera de la tarea
    • Etiquetas
  • Administrar empleos
    • Ver o eliminar tareas
    • Ver o detener ejecuciones de trabajos
  • Prácticas recomendadas
  • Realizar trabajo en segundo plano continuo
  • Desplegar grupos de trabajadores
    • Desplegar grupos de trabajadores
    • Desplegar grupos de trabajadores a partir del código fuente
  • Gestionar grupos de trabajadores
    • Ver o eliminar grupos de trabajadores
    • Ver o eliminar revisiones de grupos de trabajadores
  • Configurar grupos de trabajadores
    • Capacidad
      • Límites de memoria
      • Límites de CPU
      • GPU
        • Configuración de GPU
        • Prácticas recomendadas para GPUs
    • Entorno
      • Contenedor y punto de entrada
      • Variables de entorno
      • Montajes del volumen
        • Volúmenes de Cloud Storage
        • Volúmenes NFS
        • Volúmenes en memoria
        • Otros sistemas de archivos de red
      • Comprobaciones del estado de los contenedores
      • Secretos
      • Identidad de servicio
    • Número de instancias
    • Metadatos
      • Descripción
      • Etiquetas
      • Etiquetas
  • Escalar en función de métricas externas
    • Escalador automático de Kafka
  • Configurar redes
  • Prácticas recomendadas para las redes de Cloud Run
  • Configurar redes privadas
  • Enviar tráfico a una red de VPC
    • Introducción
    • Salida de VPC directa
    • Servicios y tareas de pila dual
    • Migrar un conector de VPC estándar a la salida de VPC directa
    • Conectores de VPC
  • Enviar tráfico a una red de VPC compartida
    • Introducción
    • Salida de VPC directa
    • Migrar un conector de VPC compartida a salida de VPC directa
    • Conectores en proyectos de servicio
    • Conectores del proyecto del host
  • Dirección IP de salida estática
  • Seguridad de la red
    • Restringir entrada (servicios)
    • Usar Controles de Servicio de VPC
  • Cloud Service Mesh
  • Seguridad
  • Información general sobre el diseño de seguridad
  • Autenticar solicitudes
    • Introducción
    • Permitir acceso público