Passa ai contenuti principali
Google Cloud
Documentazione Aree tecnologiche
  • AI e ML
  • Sviluppo di applicazioni
  • Hosting di applicazioni
  • Computing
  • Analisi dei dati e pipeline
  • Database
  • Distribuito, ibrido e multi-cloud
  • AI generativa
  • Soluzioni di settore
  • Networking
  • Osservabilità e monitoraggio
  • Sicurezza
  • Storage
Strumenti per più prodotti
  • Gestione di accessi e risorse
  • Gestione di costi e utilizzo
  • Google Cloud SDK, linguaggi, framework e strumenti
  • Infrastructure as Code (IaC)
  • Migrazione
Siti correlati
  • Home page di Google Cloud
  • Prova gratuita e livello gratuito
  • Architecture Center
  • Blog
  • Contatta il team di vendita
  • Developer Center di Google Cloud
  • Google Developer Center
  • Google Cloud Marketplace
  • Documentazione di Google Cloud Marketplace
  • Google Cloud Skills Boost
  • Google Cloud Solution Center
  • Assistenza Google Cloud
  • Canale YouTube di Google Cloud Tech
/
  • English
  • Deutsch
  • Español
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어
Console Accedi
  • Cloud Run
Guide Riferimento Esempi Risorse
Contattaci Inizia gratuitamente
Google Cloud
  • Documentazione
    • Guide
    • Riferimento
    • Esempi
    • Risorse
  • Aree tecnologiche
    • Altro
  • Strumenti per più prodotti
    • Altro
  • Siti correlati
    • Altro
  • Console
  • Contattaci
  • Inizia gratuitamente
  • Scopri
  • Panoramica del prodotto
  • Modello di risorse Cloud Run
  • Contratto runtime container
  • La mia app è adatta a un servizio Cloud Run?
  • Quando devo eseguire il deployment di una funzione?
  • Per iniziare
  • Panoramica
  • Esegui il deployment di un servizio web di esempio
    • Deployment di un container di esempio
    • Creare un repository di modelli e eseguire il deployment da un repository Git
    • Esegui il deployment di un servizio Hello World dal codice sorgente
      • Go
      • Node.js
      • Python
        • Flask
        • FastAPI
        • Gradio
        • Streamlit
      • Java
      • Kotlin
      • C#
      • C++
      • PHP
      • Ruby
      • Altro
      • Framework
        • Panoramica
        • SSR Angular
        • Next.js
        • Nuxt.js
        • SvelteKit
  • Esegui il deployment di un container di pool di worker di esempio
  • Esegui un job di esempio
    • Esegui un job
    • Eseguire un job dal codice sorgente
      • Go
      • Node.js
      • Python
      • Java
      • Shell
  • Esegui il deployment di una funzione di esempio
    • Esegui il deployment di una funzione utilizzando la console
    • Esegui il deployment di una funzione utilizzando gcloud
  • Sviluppo
  • Configura l'ambiente
  • Pianificare e preparare il servizio
    • Sviluppo del tuo servizio
    • Containerizza il codice
    • Connettersi ai servizi Google Cloud
    • Installare un pacchetto di sistema nel contenitore
    • Esegui i comandi gcloud all'interno del container
  • Agenti AI
    • Ospitare agenti AI
    • Ospitare agenti A2A
      • Panoramica degli agenti A2A host
      • Esegui il deployment di un agente A2A
      • Testa e monitora il deployment dell'agente A2A
  • Server MCP
    • Host dei server MCP
    • Crea ed esegui il deployment di un server MCP remoto
  • Pianifica e prepara la funzione
    • Panoramica
    • Confrontare le funzioni Cloud Run
    • Scrivere funzioni
      • Panoramica
      • Funzioni HTTP
      • Funzioni basate su eventi
    • Runtime
      • Panoramica
      • Node.js
        • Panoramica
        • Dipendenze Node.js
      • Python
        • Panoramica
        • Dipendenze Python
      • Go
        • Panoramica
        • Dipendenze Go
      • Java
        • Panoramica
        • Dipendenze Java
      • .NET
      • Ruby
      • PHP
    • Sviluppo di funzioni locali
    • Trigger di funzione
    • Tutorial
      • Crea una funzione che restituisce i risultati di BigQuery
      • Creare una funzione che restituisce i risultati di Spanner
      • Integrazione con i database Cloud
      • codelab
  • Sviluppare e testare
    • Esegui il build delle origini nei container
    • Crea funzioni per i container
    • Test locale
  • Gestisce le richieste HTTP
  • Deployment dei servizi
    • Deployment delle immagini container
    • Deployment continuo da git
    • Esegui il deployment dal codice sorgente
    • Esegui il deployment delle funzioni
  • Gestione del traffico web
    • Mapping di domini personalizzati
    • Gestione di asset statici con CDN
    • Gestione del traffico da più aree geografiche
    • Attivare l'affinità sessione
    • Proxy frontend con Nginx
  • Gestisci servizi
    • Visualizzare, copiare o eliminare i servizi
    • Visualizzare o eliminare le revisioni
    • Migrazione del traffico, implementazioni graduali, rollback
  • Configura i servizi
    • Panoramica
    • Capacità
      • Limiti di memoria
      • Limiti di CPU
      • GPU
        • Configurazione GPU
        • Best practice per le prestazioni della GPU
        • Esegui l'inferenza LLM sulle GPU Cloud Run con Ollama
        • Eseguire i modelli Gemma 3 su Cloud Run
        • Esegui l'inferenza LLM sulle GPU Cloud Run con vLLM
        • Esegui OpenCV su Cloud Run con accelerazione GPU
        • Esegui l'inferenza LLM sulle GPU Cloud Run con Hugging Face Transformers.js
        • Esegui l'inferenza LLM sulle GPU Cloud Run con TGI di Hugging Face
      • Richiesta scaduta
      • Numero massimo di richieste in parallelo
        • Informazioni sul numero massimo di richieste in parallelo per istanza
        • Configurare il numero massimo di richieste in parallelo
      • Fatturazione
      • Ottimizzare le configurazioni dei servizi con il motore per suggerimenti
    • Ambiente
      • Porta e punto di ingresso del container
      • Variabili di ambiente
      • Punti di montaggio volume
        • Volumi Cloud Storage
        • Volumi NFS
        • Volumi in memoria
      • Ambiente di esecuzione
        • Panoramica
        • Seleziona un ambiente di esecuzione
      • Controlli di integrità dei container
      • Richieste HTTP/2
      • Secret
      • Identità di servizio
    • Scalabilità
      • Informazioni sulla scalabilità automatica delle istanze per i servizi
      • Numero massimo di istanze
        • Informazioni sul numero massimo di istanze per i servizi
        • Configura il numero massimo di istanze
      • Numero minimo di istanze
      • Scalabilità manuale
    • Metadata
      • Descrizione
      • Etichette
      • Tags
    • Configurazioni di deployment dell'origine
      • Runtime e immagini base dei linguaggi supportati
      • Configurare gli aggiornamenti automatici delle immagini di base
      • Variabili di ambiente di build
      • Service account di Build
      • Creare pool di worker
  • Richiama e attiva i servizi
    • Eseguire il richiamo con richieste HTTPS
    • Hosting di una destinazione di webhook
    • Stream con WebSocket
      • Panoramica
      • Tutorial sulla creazione di un servizio di chat WebSocket
    • Chiama in modo asincrono
      • Richiamare i servizi in base a una pianificazione
      • Crea un flusso di lavoro
        • Richiamare i servizi nell'ambito di un flusso di lavoro
        • Tutorial su come collegare una serie di servizi da Cloud Functions e Cloud Run
      • Esegui attività asincrone
      • Chiama un servizio da una sottoscrizione push Pub/Sub
        • Attivare il servizio da Pub/Sub
        • Tutorial di esempio sull'integrazione dell'elaborazione delle immagini in Pub/Sub
    • Attiva da eventi
      • Creare trigger con Eventarc
      • Trigger Pub/Sub
        • Crea trigger EventArc Pub/Sub
        • Attivare funzioni da Pub/Sub utilizzando Eventarc
        • Attivare le funzioni dalle voci di log instradate
      • Trigger di Cloud Storage
        • Creare trigger con Cloud Storage
        • Attivare i servizi da Cloud Storage utilizzando Eventarc
        • Attivare funzioni da Cloud Storage utilizzando Eventarc
      • Trigger di Firestore
        • Creare trigger con Firestore
        • Attivare le funzioni dagli eventi in un database Firestore
    • Connettiti ad altri servizi utilizzando gRPC
  • Best practice
    • Suggerimenti generali per lo sviluppo di servizi
    • Ottimizzare i servizi Java
    • Ottimizza i servizi Python
    • Ottimizza i servizi Node.js
    • Best practice per i test di carico
    • Informazioni sulla ridondanza zonale
    • Best practice per le funzioni
      • Panoramica
      • Attivare i tentativi di funzioni basate su eventi
  • Esegui le attività del job fino al completamento
  • Creare job
  • Esegui job
    • Esegui job
    • Esegui job pianificati
    • Esegui job pianificati in un perimetro dei controlli di servizio VPC
    • Esegui job da Workflows
  • Configura i job
    • Punto di ingresso del contenitore
    • Limiti di CPU
    • Limiti di memoria
    • GPU
      • Configurazione GPU
      • Best practice per le GPU
      • Ottimizzare gli LLM utilizzando le GPU con i job Cloud Run
      • Esegui l'inferenza batch utilizzando le GPU con i job Cloud Run
    • Variabili di ambiente
    • Controlli di integrità dei container
    • Punti di montaggio volume
      • Volumi Cloud Storage
      • Volumi NFS
      • Volumi in memoria
      • Altri file system di rete
    • Etichette
    • Numero massimo di nuovi tentativi
    • Parallelismo
    • Secret
    • Identità di servizio
    • Timeout attività
    • Tags
  • Gestisci le opportunità di lavoro
    • Visualizzare o eliminare i job
    • Visualizzare o interrompere le esecuzioni dei job
  • Best practice
  • Eseguire operazioni continue in background
  • Esegui il deployment dei worker pool
    • Esegui il deployment dei worker pool
    • Esegui il deployment dei pool di worker dal codice sorgente
  • Gestire i worker pool
    • Visualizzare o eliminare i worker pool
    • Visualizzare o eliminare le revisioni del pool di worker
  • Configura i pool di worker
    • Capacità
      • Limiti di memoria
      • Limiti di CPU
      • GPU
        • Configurazione GPU
        • Best practice per le GPU
    • Ambiente
      • Container e punto di ingresso
      • Variabili di ambiente
      • Punti di montaggio volume
        • Volumi Cloud Storage
        • Volumi NFS
        • Volumi in memoria
        • Altri file system di rete
      • Controlli di integrità dei container
      • Identità di servizio
    • Numero di istanze
    • Metadata
      • Descrizione
      • Etichette
      • Tags
  • Scala in base alle metriche esterne
    • Scalabilità automatica di Kafka
  • Configurazione del networking
  • Best practice per il networking di Cloud Run
  • Configurare il networking privato
  • Invia il traffico alla rete VPC
    • Panoramica
    • VPC diretto in uscita
    • Job e servizi dual-stack
    • Esegui la migrazione del connettore VPC standard al traffico in uscita VPC diretto
    • Connettori VPC
  • Invia traffico alla rete VPC condivisa
    • Panoramica
    • VPC diretto in uscita
    • Esegui la migrazione del connettore VPC condiviso all'uscita VPC diretta
    • Connettori nei progetti di servizio
    • Connettori nel progetto host
  • Indirizzo IP in uscita statico
  • Sicurezza della rete
    • Limitare l'ingresso (servizi)
    • Utilizzare Controlli di servizio VPC
  • Cloud Service Mesh
  • Protetto
  • Panoramica della progettazione della sicurezza
  • Autentica le richieste
    • Panoramica
    • Consenti accesso pubblico
    • Segmenti di pubblico personalizzati
    • Autentica gli sviluppatori
    • Service-to-service
    • Autenticazione degli utenti
    • Tutorial sull'autenticazione degli utenti finali
  • Proteggi le tue risorse
    • Controllo dell'accesso con IAM
    • Configurare IAP per Cloud Run
    • Introduzione all'identità del servizio
    • Protezione dei servizi con Cloud Armor
    • Utilizzare l'autorizzazione binaria
    • Utilizzare Cloud Run Threat Detection
    • Utilizzare le chiavi di crittografia gestite dal cliente
    • Gestire vincoli personalizzati per i progetti