Faturação do Vertex AI RAG Engine

Esta página descreve os preços e a faturação do Vertex AI RAG Engine com base nos componentes do Vertex AI RAG Engine que usa, como modelos, reclassificação e armazenamento de vetores.

Para mais informações, consulte a página Vista geral do motor RAG da Vertex AI.

Preços e faturação

O Vertex AI RAG Engine é de utilização gratuita. No entanto, se configurar os componentes do motor RAG da Vertex AI, a faturação pode ser afetada.

Esta tabela explica como funciona a faturação quando usa os componentes RAG.

Componente Como funciona a faturação com o Vertex AI RAG Engine
Carregamento de dados O Vertex AI RAG Engine suporta a introdução de dados de diferentes origens de dados. Por exemplo, carregar ficheiros locais, do Cloud Storage e do Google Drive. O acesso a ficheiros nestas origens de dados a partir do Vertex AI RAG Engine é gratuito, mas estas origens de dados podem cobrar pela transferência de dados. Por exemplo, custos de saída de dados.
Transformação de dados (análise de ficheiros)
  • Analisador predefinido: gratuito.
  • Analizador de LLMs: o motor RAG do Vertex AI usa o modelo de LLM que especificou para analisar o seu ficheiro, e vê e paga os custos do modelo de LLM diretamente a partir do seu projeto.
  • Analizador de esquemas do Document AI: o motor RAG do Vertex AI usa o analisador de esquemas do Document AI que especificou para processar o seu ficheiro, e vê e paga a utilização do analisador de esquemas do Document AI diretamente a partir do seu projeto.
Transformação de dados (divisão de ficheiros) Suporta a divisão em partes de tamanho fixo, que é gratuita.
Geração de incorporações O Vertex AI RAG Engine orquestra a geração de incorporações através do modelo de incorporação que especificou, e o seu projeto é faturado pelos custos associados a esse modelo.

Para mais informações sobre preços, consulte o artigo Custo da criação e implementação de modelos de IA no Vertex AI.

Indexação e obtenção de dados O motor RAG suporta duas categorias de bases de dados vetoriais para a pesquisa vetorial:
  • Base de dados gerida por RAG
  • Bring-Your-Own vector database

Uma base de dados gerida pela RAG tem dois objetivos:
  • Uma base de dados gerida pela RAG armazena recursos da RAG, como corpora e ficheiros da RAG. O conteúdo dos ficheiros está excluído.
  • Com base na sua escolha, incorporação da indexação e obtenção para a pesquisa vetorial.

Uma base de dados gerida pela RAG usa uma instância do Spanner como back-end.

Para cada um dos seus projetos, o Vertex AI RAG Engine aprovisiona um Google Cloud projeto específico do cliente e gere recursos geridos pela RAG que são armazenados no Vertex AI RAG Engine, para que os seus dados estejam fisicamente isolados.

Se escolher o RagManagedDBnível básico ou o nível dimensionado, o motor RAG do Vertex AI aprovisiona uma instância da edição Enterprise do Spanner no projeto correspondente:

  • Nível básico: 100 unidades de processamento com cópia de segurança
  • Nível escalonado: a partir de 1 nó (1000 unidades de processamento) e escalonamento automático até 10 nós com cópia de segurança

Se qualquer corpus de RAG no seu projeto optar por usar uma base de dados gerida por RAG para a pesquisa vetorial, é-lhe cobrada a instância do Spanner gerida por RAG.

O motor RAG do Vertex AI apresenta os custos do Spanner do seu projeto gerido pelo RAG correspondente no seu projeto Google Cloud , para que possa ver e pagar os custos da instância do Spanner.

Para mais detalhes sobre os preços do Spanner, consulte os preços do Spanner.

Reclassificação para o Vertex AI RAG Engine As seguintes ferramentas de classificação são suportadas após a obtenção:
  • Reclassificador de LLM: o Vertex AI RAG Engine usa o modelo de LLM que especificou para reclassificar os resultados da obtenção. Vai ver e pagar os custos do modelo de LLM diretamente a partir do seu projeto.
  • API Vertex AI Search Ranking: O Vertex AI RAG Engine usa a API Vertex AI Search Ranking para reclassificar os resultados da obtenção, e verá e pagará a API Ranking diretamente a partir do seu projeto.

Elimine o Vertex AI RAG Engine

Os exemplos de código seguintes demonstram como eliminar um motor RAG da Vertex AI para a Google Cloud consola, Python e REST:

O que se segue?