Lyria | Générateur de musique IA

Vous pouvez utiliser Lyria pour générer de nouveaux morceaux de musique instrumentale à partir d'une requête de texte que vous fournissez dans la console Google Cloud ou envoyer une requête à l'API Gemini dans l'API Vertex AI.

Essayer Lyria sur Vertex AI (Vertex AI Studio)

Fonctionnalités et étape de lancement de Lyria

Lyria propose des fonctionnalités d'IA générative pour la création musicale.

Le tableau suivant décrit les fonctionnalités en disponibilité générale (DG) pour tous les utilisateurs :

Fonctionnalité Description Étape de lancement
Générer de la musique à partir de texte Générez des pistes musicales instrumentales à partir d'une entrée textuelle descriptive. Disponibilité générale
Requêtes négatives Guidez le modèle pour qu'il évite certains éléments dans la musique générée. Disponibilité générale
Source pour la reproductibilité Utilisez une graine pour garantir des résultats de génération cohérents pour une même requête et les mêmes paramètres. Disponibilité générale

Emplacements

Un emplacement est une région que vous pouvez spécifier dans une requête pour déterminer où les données sont stockées au repos. Lyria 2 est disponible dans le monde entier. Pour obtenir la liste des régions disponibles pour les services Vertex AI, consultez Emplacements IA générative sur Vertex AI.

Performances et limites

Limites Valeur
Modalités Génération de musique à partir de texte (instrumentale uniquement)
Appels d'API (requêtes par projet et par minute) Consultez la [documentation sur les quotas et les limites](/vertex-ai/generative-ai/docs/quotas) pour connaître les limites standards de Vertex AI Inference.
Latence de la requête (temps de génération) Les extraits audio sont généralement générés en 10 à 20 secondes. Il est possible que certaines demandes soient mises en file d'attente pendant les périodes de forte utilisation.
Nombre maximal d'extraits audio renvoyés par requête Jusqu'à la sample_count spécifiée. (Valeur maximale pour sample_count à déterminer, généralement un petit nombre entier, par exemple 1-4).
Durée audio par extrait 32,8 secondes
Format audio renvoyé accepté Audio WAV avec un taux d'échantillonnage de 48 kHz
Langue de la requête saisie Anglais (États-Unis) (en-us)

Une IA responsable

Lyria génère de la musique instrumentale à partir de requêtes textuelles. Lyria applique des mesures de sécurité, y compris des filtres de sécurité du contenu, des vérifications de récitation et des vérifications de l'intention de l'artiste, pour empêcher la saisie et la génération de contenus nuisibles ou inappropriés. Un filigrane SynthID est utilisé sur les contenus audio générés. Les requêtes qui ne respectent pas les consignes sur l'IA responsable peuvent être bloquées.

Versions et cycle de vie du modèle Lyria Vertex AI

Le modèle et la version de Lyria sont les suivants :

Nom du modèle Identifiant
Lyria 2 lyria-002

Générer de la musique à partir de texte

Vous pouvez générer des pistes de musique instrumentale inédites en utilisant du texte descriptif comme entrée.

Avant de commencer

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Enable the Vertex AI API.

    Enable the API

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Enable the Vertex AI API.

    Enable the API

  6. Configurez l'authentification pour votre environnement.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.

      Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

      gcloud init

      Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.

    Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .

    Console

    1. Dans la console Google Cloud , accédez à la page Vertex AI Studio > Media Studio.

      Media Studio

    2. Sélectionnez le modèle Lyria ou l'option de génération de musique.

    3. (Facultatif) Dans le volet Paramètres, configurez les paramètres suivants :

      • Modèle : sélectionnez lyria-002 si plusieurs versions sont disponibles.
      • Nombre d'échantillons (sample_count) : ajustez le nombre d'extraits audio à générer pour la requête. (Ne peut pas être utilisé avec Seed.)
      • Source : saisissez un nombre entier pour obtenir des résultats reproductibles. (Ne peut pas être utilisé avec "Nombre d'échantillons".)
    4. Dans la zone Écrivez votre requête, saisissez votre requête textuelle en anglais américain décrivant la musique à générer.

    5. Facultatif : Dans la zone Requête négative, saisissez des termes ou des descriptions à exclure de la musique générée.

    6. Cliquez sur Générer.

    7. Vous pourrez prévisualiser et télécharger les extraits audio générés au format WAV.

    REST

    Utilisez la méthode predict pour envoyer une requête de génération de musique. La réponse contiendra directement les données audio, généralement encodées en base64 si la réponse est au format JSON.

    Pour en savoir plus sur les requêtes envoyées au modèle lyria-002, consultez la documentation de référence de l'API du modèle lyria-002.

    Pour générer de la musique, envoyez une requête POST au point de terminaison predict du modèle.

    Requête :

    curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002:predict \
      -d '{
        "instances": [
          {
            "prompt": "An uplifting and hopeful orchestral piece with a soaring string melody and triumphant brass.",
            "negative_prompt": " dissonant, minor key",
            "seed": 12345
          }
        ],
        "parameters": {
          // "sample_count": 1 // Use either seed or sample_count
        }
      }'
    

    Réponse :

    Une requête réussie renvoie un objet JSON contenant les données audio générées. Voici un exemple :

    {
      "predictions": [
        {
          "audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_1",
          "mimeType": "audio/wav"
        },
        {
          "audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_2",
          "mimeType": "audio/wav"
        }
      ],
      "deployedModelId": "xxxxxxxxxxxxxxx",
      "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002",
      "modelDisplayName": "Lyria 2"
    }
    

    Vous décoderez ensuite audioContent (base64) pour obtenir le fichier audio WAV. Chaque extrait dure 32,8 secondes.

    Étapes suivantes