Ir al contenido principal
Documentación
Áreas tecnológicas
close
IA y aprendizaje automático
Desarrollo de aplicaciones
Alojamiento de aplicaciones
Computación
Analíticas y flujos de datos
Bases de datos
Tecnologías distribuidas, híbridas y multinube
IA generativa
Soluciones para sectores especializados
Redes
Observabilidad y monitorización
Seguridad
Storage
Herramientas entre productos
close
Gestión de accesos y recursos
Gestión de costes y uso
SDKs, lenguajes, frameworks y herramientas de Google Cloud
Infraestructura como código
Migración
Sitios relacionados
close
Página principal de Google Cloud
Prueba gratuita y nivel gratuito
Centro de arquitectura
Blog
Contactar con Ventas
Centro para Desarrolladores de Google Cloud
Centro para Desarrolladores de Google
Google Cloud Marketplace
Documentación de Google Cloud Marketplace
Google Cloud Skills Boost
Google Cloud Solution Center
El equipo de Asistencia de Google Cloud
Canal de YouTube de Google Cloud Tech
/
English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어
Consola
Acceder
Cloud Run
Guías
Referencia
Ejemplos
Recursos
Contacto
Empezar gratis
Documentación
Guías
Referencia
Ejemplos
Recursos
Áreas tecnológicas
Más
Herramientas entre productos
Más
Sitios relacionados
Más
Consola
Contacto
Empezar gratis
Descubrir
Descripción general del producto
Modelo de recursos de Cloud Run
Contrato de entorno de ejecución de contenedor
¿Mi aplicación es adecuada para un servicio de Cloud Run?
¿Cuándo debo implementar una función?
Empezar
Introducción
Desplegar un servicio web de ejemplo
Desplegar un contenedor de muestra
Crear un repositorio de plantillas y desplegarlo desde un repositorio de Git
Desplegar un servicio Hello World desde el código fuente
Go
Node.js
Python
Flask
FastAPI
Gradio
Streamlit
Java
Kotlin
C#
C++
PHP
Ruby
Otras
Frameworks
Introducción
SSR de Angular
Next.js
Nuxt.js
SvelteKit
Desplegar un contenedor de grupo de trabajadores de ejemplo
Ejecutar una tarea de ejemplo
Ejecutar una tarea
Ejecutar un trabajo a partir del código fuente
Go
Node.js
Python
Java
Shell
Desplegar una función de ejemplo
Desplegar una función con la consola
Desplegar una función con gcloud
Desarrollar
Configurar un entorno
Planificar y preparar el servicio
Desarrollar un servicio
Insertar el código en contenedores
Conectarse a los servicios de Google Cloud
Instalar un paquete del sistema en un contenedor
Ejecutar comandos de gcloud en tu contenedor
Agentes de IA
Alojar agentes de IA
Alojar agentes A2A
Información general sobre los agentes A2A de host
Desplegar un agente A2A
Probar y monitorizar el despliegue de agentes A2A
Servidores de MCP
Alojar servidores de MCP
Crear y desplegar un servidor de MCP remoto
Planifica y prepara tu función
Introducción
Comparar Cloud Run Functions
Escribir funciones
Introducción
Funciones HTTP
Funciones basadas en eventos
Tiempos de ejecución
Introducción
Node.js
Introducción
Dependencias de Node.js
Python
Introducción
Dependencias de Python
Go
Introducción
Dependencias de Go
Java
Introducción
Dependencias de Java
.NET
Ruby
PHP
Desarrollo de funciones locales
Activadores de funciones
Tutoriales
Crear una función que devuelva resultados de BigQuery
Crear una función que devuelva resultados de Spanner
Integración con bases de datos de Cloud
Codelabs
Compilar y probar
Crear fuentes para contenedores
Crear funciones en contenedores
Pruebas locales
Servir solicitudes HTTP
Desplegar servicios
Desplegar imágenes de contenedor
Despliegue continuo desde git
Desplegar desde el código fuente
Desplegar funciones
Servir tráfico web
Asignar dominios personalizados
Servir recursos estáticos con Cloud CDN
Servir tráfico procedente de varias regiones
Habilitar la afinidad de sesión
Proxy frontend con Nginx
Gestionar servicios
Ver, copiar o eliminar servicios
Ver o eliminar revisiones
Migración de tráfico, lanzamientos graduales y restauraciones
Configurar servicios
Introducción
Capacidad
Límites de memoria
Límites de CPU
GPU
Configuración de GPU
Prácticas recomendadas para mejorar el rendimiento de la GPU
Ejecutar la inferencia de LLMs en GPUs de Cloud Run con Ollama
Ejecutar modelos de Gemma 3 en Cloud Run
Ejecutar la inferencia de LLMs en GPUs de Cloud Run con vLLM
Ejecutar OpenCV en Cloud Run con aceleración de GPU
Ejecutar la inferencia de LLM en GPUs de Cloud Run con Hugging Face Transformers.js
Ejecutar la inferencia de LLMs en GPUs de Cloud Run con Hugging Face TGI
Tiempo de espera de solicitud agotado
Número máximo de solicitudes simultáneas
Acerca del número máximo de solicitudes simultáneas por instancia
Configurar el número máximo de solicitudes simultáneas
Facturación
Optimizar las configuraciones de servicios con el recomendador
Entorno
Puerto y punto de entrada del contenedor
Variables de entorno
Montajes del volumen
Volúmenes de Cloud Storage
Volúmenes NFS
Volúmenes en memoria
Entorno de ejecución
Introducción
Seleccionar un entorno de ejecución
Comprobaciones del estado de los contenedores
Solicitudes HTTP/2
Secretos
Identidad de servicio
Escalado
Información sobre el autoescalado de instancias para servicios
Número máximo de instancias
Acerca del número máximo de instancias de los servicios
Configurar el número máximo de instancias
Número mínimo de instancias
Escalado manual
Metadatos
Descripción
Etiquetas
Etiquetas
Configuraciones de implementación de origen
Runtimes e imágenes base de los idiomas admitidos
Configurar actualizaciones automáticas de la imagen base
Variables de entorno de desarrollo
Cuenta de servicio de compilación
Grupos de trabajadores de Cloud Build
Invocar y activar servicios
Invocar con solicitudes HTTPS
Alojar un destino webhook
Streaming con WebSockets
Introducción
Tutorial para crear un servicio de chat de WebSocket
Invocar de forma asíncrona
Invocar servicios según una programación
Crear un flujo de trabajo
Invocar servicios como parte de un flujo de trabajo
Conectar una serie de servicios desde Cloud Functions y Cloud Run
Ejecutar tareas asíncronas
Llamar a un servicio desde una suscripción de inserción de Pub/Sub
Activar un servicio desde Pub/Sub
Integrar el procesamiento de imágenes en el tutorial de ejemplo de Pub/Sub
Activadores de eventos
Crear activadores con Eventarc
Activadores de Pub/Sub
Crear activadores de Eventarc de Pub/Sub
Activar funciones desde Pub/Sub mediante Eventarc
Activar funciones a partir de entradas de registro enrutadas
Activadores de Cloud Storage
Crear activadores con Cloud Storage
Activar servicios desde Cloud Storage con Eventarc
Activar funciones de Cloud Storage con Eventarc
Activadores de Firestore
Crear activadores con Firestore
Activar funciones a partir de eventos de una base de datos de Firestore
Conectarse con otros servicios mediante gRPC
Prácticas recomendadas
Consejos generales de desarrollo para servicios
Optimizar servicios Java
Optimizar servicios de Python
Optimizar servicios de Node.js
Prácticas recomendadas para las pruebas de carga
Información sobre la redundancia zonal
Prácticas recomendadas para las funciones
Introducción
Habilitar los reintentos de funciones basadas en eventos
Ejecutar tareas hasta su finalización
Crear tareas
Ejecutar tareas
Ejecutar tareas
Ejecutar tareas programadas
Ejecutar tareas programadas en un perímetro de los controles de servicio de VPC
Ejecutar tareas desde Workflows
Configurar tareas
Punto de entrada del contenedor
Límites de CPU
Límites de memoria
GPU
Configuración de GPU
Prácticas recomendadas para GPUs
Afinar LLMs con GPUs mediante tareas de Cloud Run
Ejecutar inferencia por lotes con GPUs mediante Cloud Run Jobs
Variables de entorno
Comprobaciones del estado de los contenedores
Montajes del volumen
Volúmenes de Cloud Storage
Volúmenes NFS
Volúmenes en memoria
Otros sistemas de archivos de red
Etiquetas
Número máximo de reintentos
Paralelismo
Secretos
Identidad de servicio
Tiempo de espera de la tarea
Etiquetas
Administrar empleos
Ver o eliminar tareas
Ver o detener ejecuciones de trabajos
Prácticas recomendadas
Realizar trabajo en segundo plano continuo
Desplegar grupos de trabajadores
Desplegar grupos de trabajadores
Desplegar grupos de trabajadores a partir del código fuente
Gestionar grupos de trabajadores
Ver o eliminar grupos de trabajadores
Ver o eliminar revisiones de grupos de trabajadores
Configurar grupos de trabajadores
Capacidad
Límites de memoria
Límites de CPU
GPU
Configuración de GPU
Prácticas recomendadas para GPUs
Entorno
Contenedor y punto de entrada
Variables de entorno
Montajes del volumen
Volúmenes de Cloud Storage
Volúmenes NFS
Volúmenes en memoria
Otros sistemas de archivos de red
Comprobaciones del estado de los contenedores
Secretos
Identidad de servicio
Número de instancias
Metadatos
Descripción
Etiquetas
Etiquetas
Escalar en función de métricas externas
Escalador automático de Kafka
Configurar redes
Prácticas recomendadas para las redes de Cloud Run
Configurar redes privadas
Enviar tráfico a una red de VPC
Introducción
Salida de VPC directa
Servicios y tareas de pila dual
Migrar un conector de VPC estándar a la salida de VPC directa
Conectores de VPC
Enviar tráfico a una red de VPC compartida
Introducción
Salida de VPC directa
Migrar un conector de VPC compartida a salida de VPC directa
Conectores en proyectos de servicio
Conectores del proyecto del host
Dirección IP de salida estática
Seguridad de la red
Restringir entrada (servicios)
Usar Controles de Servicio de VPC
Cloud Service Mesh
Seguridad
Información general sobre el diseño de seguridad
Autenticar solicitudes
Introducción
Permitir acceso público