Ausgabeauflösung festlegen

Mit Imagen in Vertex AI können Sie die Ausgaberauflösung generierter Bilder festlegen, wenn Sie die folgenden Imagen 4-Modelle verwenden:

  • imagen-4.0-generate-001
  • imagen-4.0-ultra-generate-001

Console

  1. Rufen Sie in der Google Cloud Console die Seite Vertex AI > Vertex AI Studio auf.

    Zu Vertex AI Studio

  2. Klicken Sie auf Media generieren.

  3. Klicken Sie auf Bild.

  4. Wählen Sie in der Liste Aufgabe die Option Text-zu-Bild aus.

  5. Wählen Sie in der Liste Modell das zu verwendende Imagen-Modell aus.

  6. Geben Sie im Feld Prompt einen Prompt ein, der beschreibt, wie das Bild bearbeitet werden soll.

  7. Klicken Sie auf  chevron_forward Parameter und passen Sie die folgenden Optionen an:

    • Seitenverhältnis: Wählen Sie ein Seitenverhältnis aus den verfügbaren Optionen aus.
    • Anzahl der Ergebnisse: Ziehen Sie den Schieberegler, um 1 bis 4 generierte Bilder auszuwählen.
    • Ausgabeauflösung: Wählen Sie eine Ausgabeauflösung aus den verfügbaren Optionen aus.
  8. Klicken Sie auf Ausführen.

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • REGION: Die Region, in der sich Ihr Projekt befindet. Weitere Informationen zu unterstützten Regionen finden Sie unter Generative AI in Vertex AI-Standorten.
  • TEXT_PROMPT: Der Text-Prompt, der zum Generieren von Bildern verwendet werden soll.
  • PROJECT_ID: Ihre Google Cloud Projekt-ID.
  • MODEL_VERSION: Die zu verwendende Imagen-Modellversion. Die folgenden Werte sind bei Verwendung von sampleImageSize zulässig:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION: Die Auflösung des Ausgabebilds. Folgendes wird akzeptiert:
    • "1K"
    • "2K"

    Die Standardeinstellung ist "1K".

  • IMAGE_COUNT: Die Anzahl der zu generierenden Bilder. Der zulässige Wertebereich liegt zwischen 1 und 4.

HTTP-Methode und URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
Bei der Anfrage werden Bildobjekte zurückgegeben. In diesem Beispiel werden zwei Bildobjekte mit zwei Vorhersageobjekten als base64-codierte Bilder zurückgegeben.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}