Esta página descreve os preços e a faturação do Vertex AI RAG Engine com base nos componentes do Vertex AI RAG Engine que usa, como modelos, reclassificação e armazenamento de vetores.
Para mais informações, consulte a página Vista geral do motor RAG da Vertex AI.
Preços e faturação
O Vertex AI RAG Engine é de utilização gratuita. No entanto, se configurar os componentes do motor RAG da Vertex AI, a faturação pode ser afetada.
Esta tabela explica como funciona a faturação quando usa os componentes RAG.
Componente | Como funciona a faturação com o Vertex AI RAG Engine |
---|---|
Carregamento de dados | O Vertex AI RAG Engine suporta a introdução de dados de diferentes origens de dados. Por exemplo, carregar ficheiros locais, do Cloud Storage e do Google Drive. O acesso a ficheiros nestas origens de dados a partir do Vertex AI RAG Engine é gratuito, mas estas origens de dados podem cobrar pela transferência de dados. Por exemplo, custos de saída de dados. |
Transformação de dados (análise de ficheiros) |
|
Transformação de dados (divisão de ficheiros) | Suporta a divisão em partes de tamanho fixo, que é gratuita. |
Geração de incorporações | O Vertex AI RAG Engine orquestra a geração de incorporações através do modelo de incorporação que especificou, e o seu projeto é faturado pelos custos associados a esse modelo. Para mais informações sobre preços, consulte o artigo Custo da criação e implementação de modelos de IA no Vertex AI. |
Indexação e obtenção de dados |
O motor RAG suporta duas categorias de bases de dados vetoriais para a pesquisa vetorial:
Uma base de dados gerida pela RAG tem dois objetivos:
Uma base de dados gerida pela RAG usa uma instância do Spanner como back-end. Para cada um dos seus projetos, o Vertex AI RAG Engine aprovisiona um Google Cloud projeto específico do cliente e gere recursos geridos pela RAG que são armazenados no Vertex AI RAG Engine, para que os seus dados estejam fisicamente isolados. Se escolher o
Se qualquer corpus de RAG no seu projeto optar por usar uma base de dados gerida por RAG para a pesquisa vetorial, é-lhe cobrada a instância do Spanner gerida por RAG. O motor RAG do Vertex AI apresenta os custos do Spanner do seu projeto gerido pelo RAG correspondente no seu projeto Google Cloud , para que possa ver e pagar os custos da instância do Spanner. Para mais detalhes sobre os preços do Spanner, consulte os preços do Spanner. |
Reclassificação para o Vertex AI RAG Engine | As seguintes ferramentas de classificação são suportadas após a obtenção:
|
Elimine o Vertex AI RAG Engine
Os exemplos de código seguintes demonstram como eliminar um motor RAG da Vertex AI para a Google Cloud consola, Python e REST:
Parâmetros da API versão 1 (v1) e exemplos de código.
Parâmetros da API v1beta1 e exemplos de código.
O que se segue?
- Para saber como usar o SDK Vertex AI para executar tarefas do Vertex AI RAG Engine, consulte o guia de início rápido do RAG para Python.
- Para saber mais sobre a fundamentação, consulte a vista geral da fundamentação.
- Para saber mais sobre as respostas da RAG, consulte o artigo Resultados de obtenção e geração do motor RAG da Vertex AI.
- Para saber mais sobre a arquitetura RAG: