Menempatkan respons menggunakan RAG

Perujukan adalah teknik yang dapat Anda gunakan untuk membantu menghasilkan respons model yang lebih tepercaya, bermanfaat, dan faktual. Saat Anda mendasarkan respons model AI generatif, Anda menghubungkannya ke sumber informasi yang dapat diverifikasi. Untuk menerapkan perujukan, biasanya Anda harus mengambil data sumber yang relevan. Praktik terbaik yang direkomendasikan adalah menggunakan teknik retrieval-augmented generation (RAG). Perolehan biasanya dilakukan menggunakan mesin telusur, yang menggunakan indeks yang disematkan dengan makna semantik teks sumber.

Ada juga layanan dan API komponen yang menerapkan siklus proses RAG, seperti Vertex AI Search Builder API, yang memungkinkan pembuatan campuran dan padanan. Dengan pembuatan kombinasi, Anda dapat menerapkan solusi RAG menggunakan salah satu layanan atau API berikut:

  • API pembuatan berbasis data yang terpercaya: Anda dapat menggunakannya untuk menerapkan perujukan, atau menautkan ke penyedia pengambilan untuk siklus proses RAG yang lengkap.
  • Pengurai tata letak dokumen: Pengurai ini mewakili yang terbaik dari Document AI dan Gemini untuk pemahaman dokumen. Untuk mengetahui informasi selengkapnya tentang parser tata letak, lihat Menggunakan parser tata letak.
  • Vertex AI Vector Search: Layanan penelusuran ini berperforma tinggi dan menggunakan database vektor berkualitas tinggi.
  • Check grounding API: API ini membandingkan output RAG dengan fakta yang diambil dan membantu memastikan bahwa semua pernyataan memiliki rujukan sebelum menampilkan respons kepada pengguna.

Meng-grounding respons menggunakan Mesin RAG Vertex AI

Untuk melakukan grounding respons menggunakan Vertex AI RAG Engine, Anda harus membuat perintah. Lakukan tindakan berikut:

  1. Di konsol Google Cloud , buka halaman Create prompt menggunakan Vertex AI Studio.

    Buka Buat perintah

  2. Pilih Perujukan: Data Anda.

  3. Pilih sumber perujukan Mesin RAG.

  4. Dari daftar Corpus, pilih nama korpus Anda.

  5. Di kolom Top-K Similarity, pilih 20, yang merupakan nilai default.

  6. Klik Simpan.

Langkah berikutnya