Guia de comandos do Lyria para geração de música

Este guia apresenta exemplos dos tipos de paisagens sonoras de música e áudio que podem ser criados com o Lyria e mostra como modificar partes específicas de uma solicitação para produzir resultados diferentes.

Visão geral do guia de comandos

O Lyria é um modelo de base para a geração de áudio de alta qualidade, capaz de criar diversos cenários sonoros e peças musicais a partir de comandos de texto. Para usar o Lyria, você precisa fornecer um comando, que é uma descrição em texto do que você quer que seu modelo de IA generativa gere. Lyria produz música instrumental.

Filtros de segurança

O Lyria aplica filtros de segurança em toda a Vertex AI para garantir que o áudio gerado não contenha conteúdo ofensivo ou viole as diretrizes de uso. Por exemplo, comandos que violam as diretrizes de IA responsável são bloqueados. O Lyria também inclui a verificação de recitação e de intenção do artista.

Se você suspeitar de abuso do Lyria ou de qualquer saída gerada que contenha material inadequado ou informações imprecisas, use o formulário Denunciar suspeita de abuso no Google Cloud.

Noções básicas para escrever comandos

Boas instruções são descritivas e claras. Para que a música gerada se aproxime do que você quer, comece identificando sua ideia musical principal e, em seguida, refine a ideia adicionando palavras-chave e modificadores.

Os seguintes elementos devem ser considerados para o comando:

  1. Gênero e estilo:a categoria musical principal (por exemplo, música eletrônica, clássica, jazz, ambiente) e as características estilísticas (por exemplo, 8 bits, cinematográfica, lo-fi).
  2. Humor e emoção:o sentimento que a música deve evocar (por exemplo, energética, melancólica, tranquila, tensa).
  3. Instrumentação:os principais instrumentos que você quer ouvir (por exemplo, piano, sintetizador, violão acústico, orquestra de cordas, bateria eletrônica).
  4. Tempo e ritmo:o andamento (por exemplo, tempo rápido, balada lenta, 120 BPM) e o caráter rítmico (por exemplo, ritmo forte, ritmo sincopado, valsa suave).
  5. (Opcional) Arranjo/estrutura:como a música progride ou é dividida em camadas (por exemplo, começa com um piano solo, depois entram as cordas, crescendo em um refrão poderoso).
  6. (Opcional) Ambiente sonoro/som ambiente:sons de fundo ou ambiente sônico geral (por exemplo, chuva, vida noturna da cidade, reverberação espaçosa, sensação de estar debaixo d’água).
  7. (Opcional) Qualidade de produção:fidelidade de áudio ou estilo de gravação desejado (por exemplo, produção de alta qualidade, mix limpo, gravação vintage, clima de demonstração bruta).

Exemplos de comandos e saída gerada

Esta seção apresenta instruções e como o nível de detalhes pode afetar a música.

Música eletrônica enérgica

Este exemplo demonstra o uso de vários elementos no comando.

Comando Saída gerada
Uma música de dança eletrônica (gênero) energética (clima) com um tempo (tempo) rápido e um ritmo forte (ritmo), com sintetizadores (instrumentação) e bateria eletrônica (instrumentação) proeminentes. Produção de alta qualidade (qualidade de produção).

Descrição: uma faixa instrumental de 30 segundos com um som eletrônico claro e forte, ritmo animado, foco em melodias de sintetizador e uma forte presença de bateria.

Evolução da paisagem sonora ambiente

Esses exemplos mostram como revisar o comando para resultados mais específicos.

Comando Saída gerada Análise
Música ambiente com sintetizadores.

Descrição: uma peça ambient básica que usa principalmente pads de sintetizador. O clima e a estrutura são muito gerais.

Este é o primeiro áudio gerado com base em uma instrução mínima.
Um cenário sonoro ambiental calmo e sonhador (gênero/estilo) com sintetizadores em camadas (instrumentação) e pads suaves e em evolução (instrumentação/arranjo). Tempo lento com reverberação espaçosa (ambiente/produção). Começa com uma melodia simples de sintetizador e depois adiciona camadas de pads atmosféricas (arranjo).

Descrição: uma faixa ambiente mais desenvolvida. O áudio evoca um estado tranquilo e sonhador com camadas de sintetizador claras sendo criadas lentamente. O reverb amplo melhora a qualidade atmosférica.

Uma instrução mais detalhada resulta em uma música mais focada, com um ambiente sonoro mais rico e uma progressão clara.

Mais dicas para escrever comandos

As dicas a seguir ajudam você a escrever comandos eficazes para a Lyria:

  • Ser descritivo e específico:use adjetivos e advérbios para criar uma imagem sonora clara. Quanto mais detalhes, melhor a Lyria vai entender sua intenção.
  • Referências de gêneros, climas e estilos:indique claramente a categoria musical, a sensação desejada e as características estilísticas.
  • Especificar instrumentos e ritmos principais:mencione instrumentos importantes e descreva o ritmo e a sensação rítmica desejados.
  • Iterar e experimentar:se o primeiro resultado não for perfeito, modifique o comando adicionando, removendo ou alterando palavras-chave. Consulte a Introdução à solicitação para estratégias gerais.

Adicionar mais detalhes aos comandos

Estes exemplos mostram como refinar comandos com foco em elementos musicais específicos.

Gênero e estilo

Foco no elemento Comando Saída gerada
Gênero e estilo Uma peça orquestral cinematográfica em um estilo heroico de aventura de fantasia, com uma melodia grandiosa e ampla.

Descrição: espere uma faixa orquestrada com sons completos, com ondas dramáticas e um tema forte e memorável, que lembra a trilha sonora de um filme.

Humor e instrumentação

Foco no elemento Comando Saída gerada
Humor e instrumentação Uma música tranquila e serena de violão acústico, com um estilo de dedilhado, perfeita para meditação.

Descrição: uma faixa instrumental suave e relaxante com um violão acústico solo tocando uma melodia simples e suave.

Tempo e ritmo

Foco no elemento Comando Saída gerada
Tempo e ritmo Uma trilha sonora tensa e de suspense com um tempo muito lento e um ritmo irregular e esparso. Usa principalmente cordas graves e percussão sutil.

Descrição: uma música atmosférica projetada para criar tensão, caracterizada pelo ritmo lento, elementos rítmicos inquietantes e texturas escuras de cordas.

Solicitações negativas

As solicitações negativas ajudam a especificar elementos a serem excluídos da música. Descreva o que você quer que o modelo não gere.

  • O parâmetro da API é negative_prompt.
  • Liste os elementos a serem excluídos, por exemplo: negative_prompt: "vocals, excessive cymbal crashes, distorted guitar"
Cenário de comando Saída gerada
Comando: "Uma música de piano calma e relaxante para estudar."

(Sem comando negativo)

Descrição: a música de piano é geralmente calma, mas pode incluir algumas dinâmicas mais altas inesperadas ou execuções complexas que podem distrair o estudo.

Comando: "Uma música de piano calma e relaxante para estudar."
Comando negativo: "melodias complexas, dinâmicas altas, mudanças repentinas, bateria, vocais"

Descrição: a peça de piano resultante é consistentemente calma e simples, evitando elementos que distraem. O clima é mais uniforme e adequado para o foco em segundo plano.