Esta página foi traduzida pela API Cloud Translation.

Faturação do Vertex AI RAG Engine

Esta página descreve os preços e a faturação do Vertex AI RAG Engine com base nos componentes do Vertex AI RAG Engine que usa, como modelos, reclassificação e armazenamento de vetores.

Para mais informações, consulte a página Vista geral do motor RAG da Vertex AI.

Preços e faturação

O Vertex AI RAG Engine é de utilização gratuita. No entanto, se configurar os componentes do motor RAG da Vertex AI, a faturação pode ser afetada.

Esta tabela explica como funciona a faturação quando usa os componentes RAG.

Componente	Como funciona a faturação com o Vertex AI RAG Engine
Carregamento de dados	O Vertex AI RAG Engine suporta a introdução de dados de diferentes origens de dados. Por exemplo, carregar ficheiros locais, do Cloud Storage e do Google Drive. O acesso a ficheiros nestas origens de dados a partir do Vertex AI RAG Engine é gratuito, mas estas origens de dados podem cobrar pela transferência de dados. Por exemplo, custos de saída de dados.
Transformação de dados (análise de ficheiros)	Analisador predefinido: gratuito. Analizador de LLMs: o motor RAG do Vertex AI usa o modelo de LLM que especificou para analisar o seu ficheiro, e vê e paga os custos do modelo de LLM diretamente a partir do seu projeto. Analizador de esquemas do Document AI: o motor RAG do Vertex AI usa o analisador de esquemas do Document AI que especificou para processar o seu ficheiro, e vê e paga a utilização do analisador de esquemas do Document AI diretamente a partir do seu projeto.
Transformação de dados (divisão de ficheiros)	Suporta a divisão em partes de tamanho fixo, que é gratuita.
Geração de incorporações	O Vertex AI RAG Engine orquestra a geração de incorporações através do modelo de incorporação que especificou, e o seu projeto é faturado pelos custos associados a esse modelo. Para mais informações sobre preços, consulte o artigo Custo da criação e implementação de modelos de IA no Vertex AI.
Indexação e obtenção de dados	O motor RAG suporta duas categorias de bases de dados vetoriais para a pesquisa vetorial: Base de dados gerida por RAG Bring-Your-Own vector database Uma base de dados gerida pela RAG tem dois objetivos: Uma base de dados gerida pela RAG armazena recursos da RAG, como corpora e ficheiros da RAG. O conteúdo dos ficheiros está excluído. Com base na sua escolha, incorporação da indexação e obtenção para a pesquisa vetorial. Uma base de dados gerida pela RAG usa uma instância do Spanner como back-end. Para cada um dos seus projetos, o Vertex AI RAG Engine aprovisiona um Google Cloud projeto específico do cliente e gere recursos geridos pela RAG que são armazenados no Vertex AI RAG Engine, para que os seus dados estejam fisicamente isolados. Se escolher o `RagManagedDB`nível básico ou o nível dimensionado, o motor RAG do Vertex AI aprovisiona uma instância da edição Enterprise do Spanner no projeto correspondente: Nível básico: 100 unidades de processamento com cópia de segurança Nível escalonado: a partir de 1 nó (1000 unidades de processamento) e escalonamento automático até 10 nós com cópia de segurança Se qualquer corpus de RAG no seu projeto optar por usar uma base de dados gerida por RAG para a pesquisa vetorial, é-lhe cobrada a instância do Spanner gerida por RAG. O motor RAG do Vertex AI apresenta os custos do Spanner do seu projeto gerido pelo RAG correspondente no seu projeto Google Cloud , para que possa ver e pagar os custos da instância do Spanner. Para mais detalhes sobre os preços do Spanner, consulte os preços do Spanner.
Reclassificação para o Vertex AI RAG Engine	As seguintes ferramentas de classificação são suportadas após a obtenção: Reclassificador de LLM: o Vertex AI RAG Engine usa o modelo de LLM que especificou para reclassificar os resultados da obtenção. Vai ver e pagar os custos do modelo de LLM diretamente a partir do seu projeto. API Vertex AI Search Ranking: O Vertex AI RAG Engine usa a API Vertex AI Search Ranking para reclassificar os resultados da obtenção, e verá e pagará a API Ranking diretamente a partir do seu projeto.

Elimine o Vertex AI RAG Engine

Os exemplos de código seguintes demonstram como eliminar um motor RAG da Vertex AI para a Google Cloud consola, Python e REST:

Parâmetros da API versão 1 (v1) e exemplos de código.
Parâmetros da API v1beta1 e exemplos de código.

O que se segue?

Para saber como usar o SDK Vertex AI para executar tarefas do Vertex AI RAG Engine, consulte o guia de início rápido do RAG para Python.
Para saber mais sobre a fundamentação, consulte a vista geral da fundamentação.
Para saber mais sobre as respostas da RAG, consulte o artigo Resultados de obtenção e geração do motor RAG da Vertex AI.
Para saber mais sobre a arquitetura RAG:
- Infraestrutura para uma aplicação de IA generativa com capacidade de RAG que usa o Vertex AI e a pesquisa vetorial
- Infraestrutura para uma aplicação de IA generativa com capacidade de RAG que usa a Vertex AI e o AlloyDB para PostgreSQL.

Faturação do Vertex AI RAG Engine Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Preços e faturação

Elimine o Vertex AI RAG Engine

O que se segue?

Faturação do Vertex AI RAG Engine