Inhalte von Tabellenspeichern manuell verwalten

Auf dieser Seite wird beschrieben, wie Sie den Inhalt der spaltenorientierten Engine manuell verwalten, um die Abfrageleistung zu beschleunigen. Darin wird beschrieben, wie Sie Tabellen, materialisierte Ansichten und ScaNN-Indizes hinzufügen und entfernen.

Tabellen, materialisierte Ansichten und ScaNN-Indizes verwalten

Je nach Arbeitslast können Sie dem Spaltenspeicher manuell Spalten hinzufügen oder einige oder alle Spalten einer Tabelle oder einer materialisierten Ansicht daraus entfernen. Bei der Abfrageauswertung werden automatisch die gespeicherten spaltenorientierten Daten verwendet, um Abfragen zu beantworten.

Sie können der spaltenorientierten Engine auch manuell einen ScaNN-Index hinzufügen, um die Vektorsuche zu beschleunigen. Dies ermöglicht effiziente Suchanfragen für den nächsten Nachbarn in großen Datasets mit Vektoreinbettungen.

Berücksichtigen Sie bei der Auswahl der Tabellen, materialisierten Ansichten und Spalten, die dem Spaltenspeicher hinzugefügt werden sollen, sowohl die Größe des Spaltenspeichers als auch die Art der Arbeitslast. Gute Kandidaten für die Auswahl sind große Tabellen oder Ansichten, die häufig gescannt werden. Suchen Sie in diesen Tabellen oder Ansichten nach großen, nicht eindeutigen Indexen, die von der OLAP-Arbeitslast verwendet werden. Sie können die Spalten dieser Indexe dem Spaltenspeicher hinzufügen und die Indexe möglicherweise löschen. Dadurch entfällt der Leistungsaufwand, der mit der Wartung auf der primären Instanz verbunden ist.

Verwenden Sie eine der folgenden Methoden, um den Inhalt der spaltenorientierten Engine zu verwalten:

Informationen dazu, welche Datentypen und Datenquellen Sie verwenden können, wenn Sie dem Spaltenspeicher Tabellen, Spalten und materialisierten Ansichten hinzufügen, finden Sie unter Welche Daten können dem Spaltenspeicher hinzugefügt werden?.

Hinweise

  • Sie benötigen eine der folgenden IAM-Rollen im Google Cloud Projekt, das Sie verwenden:
    • roles/alloydb.admin (die vordefinierte IAM-Rolle „AlloyDB Admin“)
    • roles/owner (einfache IAM-Rolle „Inhaber“)
    • roles/editor (einfache IAM-Rolle „Bearbeiter“)

    Wenn Sie keine dieser Rollen haben, wenden Sie sich an den Organisationsadministrator, um Zugriff anzufordern.

Spaltenspeicherinhalte durch Aktualisieren von Datenbank-Flags verwalten

Sie können Spaltenspeicherinhalte manuell verwalten, indem Sie das Datenbankflag google_columnar_engine.relations aktualisieren. Das Flag hat einen einzelnen Wert, der alle Datenquellen Ihres Spaltenspeichers angibt. Während des Neustarts werden die in diesem Flag angegebenen Spalten automatisch in den Spaltenspeicher eingefügt.

Sie können dieses Flag zusammen mit der automatischen Spaltenaufteilung verwenden. Wenn die spaltenorientierte Engine nach dem Auffüllen der Spalten, die Sie über das Flag google_columnar_engine.relations angeben, noch Speicherplatz hat, werden bei der automatischen Spaltenorientierung nach Bedarf weitere Spalten zum Spaltenspeicher hinzugefügt.

Weitere Informationen zum Festlegen der Datenbank-Flags einer Instanz mit der Google Cloud CLI oder der Google Cloud Console finden Sie unter Datenbank-Flags einer Instanz konfigurieren.

Spalten mithilfe von Flags hinzufügen

Wenn Sie dem Spaltenspeicher Spalten hinzufügen möchten, definieren Sie das google_columnar_engine.relations-Flag einer Instanz. Legen Sie den Wert auf eine durch Kommas getrennte Liste von Elementen fest. Jedes Element gibt eine Liste von Spalten an, die aus einer bestimmten Tabelle eingeschlossen werden sollen. Das Format ist:

DATABASE_NAME.SCHEMA_NAME.TABLE_NAME(COLUMN_LIST)

Ersetzen Sie Folgendes:

  • DATABASE_NAME: Die Datenbank mit den Spalten, die dem Spaltenspeicher hinzugefügt werden sollen.

  • SCHEMA_NAME: Das Schema, das die Tabellen oder materialisierten Ansichten identifiziert, die dem Spaltenspeicher hinzugefügt werden sollen, z. B. public.

  • TABLE_NAME: Die Tabelle oder die materialisierte Ansicht mit den Spalten, die dem Spaltenspeicher hinzugefügt werden sollen.

  • COLUMN_LIST: Eine durch Kommas getrennte Liste der Spalten, die dem Spaltenspeicher hinzugefügt werden sollen.

Wenn Sie alle Spalten einer Tabelle oder materialisierten Ansicht hinzufügen möchten, lassen Sie die Spaltenliste weg:

DATABASE_NAME.SCHEMA_NAME.TABLE_NAME

Weitere Informationen zum Festlegen der Datenbank-Flags für eine Instanz finden Sie unter Datenbank-Flags einer Instanz konfigurieren.

Google Cloud CLI-Syntax bei Verwendung von google_columnar_engine.relations

Wenn Sie das Flag google_columnar_engine.relations mit der Google Cloud CLI festlegen, müssen Sie die alternative Trennzeichen-Syntax verwenden, um die von Ihnen festgelegten Datenbank-Flags zu trennen. Das liegt daran, dass die Spaltenliste durch Kommas getrennt ist. Daher müssen Sie ein anderes Zeichen als ein Komma verwenden, wenn Sie Flags innerhalb desselben Befehlszeilenarguments angeben.

Im folgenden Beispiel wird gezeigt, wie Sie mit der gcloud CLI dem Spaltenspeicher zwei Spalten im public-Schema hinzufügen. Im Beispiel wird ein separates Flag zum Aktivieren der spaltenorientierten Engine festgelegt, da beim Festlegen eines beliebigen Datenbankflags mit dem Befehl gcloud alloydb instance update auch alle anderen Datenbankflags festgelegt werden müssen, für die Sie nicht die Standardwerte verwenden möchten, auch wenn sie bereits festgelegt sind.

gcloud alloydb instances update INSTANCE_NAME \
    --database-flags=^:^\
google_columnar_engine.relations='DATABASE_NAME.public.TABLE_NAME(COLUMN_1,COLUMN_2)'\
:google_columnar_engine.enabled=on\
[:FLAG_3=VALUE_3 ...] \
    --region=REGION_ID \
    --cluster=CLUSTER_ID

Spalten mithilfe von Flags löschen

Wenn Sie Spalten aus dem Spaltenspeicher entfernen möchten, legen Sie einen neuen Wert für das im vorherigen Abschnitt beschriebene Flag google_columnar_engine.relations fest und lassen Sie die Spalten aus, die Sie entfernen möchten.

Wenn Sie alle Spalten aus dem Spaltenspeicher entfernen möchten, deaktivieren Sie das Flag google_columnar_engine.relations für Ihre Instanz.

Weitere Informationen zum Festlegen von Datenbank-Flags für eine Instanz finden Sie unter Datenbank-Flags einer Instanz konfigurieren.

Spaltenspeicherinhalte mit SQL-Funktionen verwalten

Sie können Spaltenspeicherinhalte manuell mit SQL-Funktionen verwalten.

Spalten mit SQL-Funktionen hinzufügen

Führen Sie die SQL-Funktion google_columnar_engine_add aus, um dem Spaltenspeicher Spalten hinzuzufügen.

Mit dieser Methode werden die angegebenen Spalten dem Spaltenspeicher hinzugefügt und nur im verbundenen Knoten verwaltet. Die neuen Spalten bleiben im Speicher nicht über Instanzneustarts hinweg erhalten.

Bei dieser Methode wird das Datenbankflag google_columnar_engine.relations nicht geändert. Bei der automatischen Spaltenaufteilung werden Spalten, die mit dieser SQL-Funktion hinzugefügt wurden, nicht berücksichtigt.

psql-Client

SELECT google_columnar_engine_add(
    relation => 'TABLE_NAME',
    columns => 'COLUMN_LIST'
);
    Ersetzen Sie Folgendes:
  • 'TABLE_NAME': Ein String, der den Namen der Tabelle oder der materialisierten Ansicht enthält. Wenn sich die Tabelle oder Ansicht in einem anderen Schema als public befindet, geben Sie den Namen des Schemas, einen Punkt und den Namen der Tabelle oder Ansicht an, z. B. 'myschema.mytable'.
  • COLUMN_LIST“: Ein String mit einer durch Kommas getrennten, groß-/kleinschreibungsabhängigen Liste der Namen der Spalten, die Sie hinzufügen möchten. Wenn Sie alle Spalten der Tabelle oder der materialisierten Ansicht dem Spaltenspeicher hinzufügen möchten, lassen Sie diesen Parameter weg.

Spalten mit SQL-Funktionen löschen

Führen Sie die SQL-Funktion google_columnar_engine_drop so aus:

psql-Client

SELECT google_columnar_engine_drop(
    relation => 'TABLE_NAME',
    columns => 'COLUMN_LIST'
);
Ersetzen Sie Folgendes:
  • 'TABLE_NAME': Ein String, der den Namen der Tabelle oder der materialisierten Ansicht enthält. Wenn sich die Tabelle oder Ansicht in einem anderen Schema als public befindet, geben Sie den Namen des Schemas, einen Punkt und den Namen der Tabelle oder Ansicht an, z. B. 'myschema.mytable'.
  • COLUMN_LIST“: Ein String mit einer durch Kommas getrennten, groß-/kleinschreibungsabhängigen Liste der Namen der Spalten, die Sie hinzufügen möchten. Wenn Sie alle Spalten der Tabelle oder der materialisierten Ansicht dem Spaltenspeicher hinzufügen möchten, lassen Sie diesen Parameter weg.

Mit der Funktion google_columnar_engine_drop können Sie Spalten entfernen, die durch Bearbeiten des Datenbankflags google_columnar_engine.relations hinzugefügt wurden. Wenn Sie das tun, werden diese Spalten jedoch beim Neustart der Instanz wieder dem spaltenorientierten Speicher hinzugefügt.

ScaNN-Indexe in der spaltenbasierten Engine verwalten

Um die Vektorsuche zu beschleunigen, können Sie ScaNN-Indizes in den Indexcache der spaltenbasierten Engine laden.

ScaNN-Indexe manuell mit SQL-Funktionen hinzufügen und entfernen

Sie können ScaNN-Indizes mithilfe von SQL-Funktionen manuell in den Indexcache einfügen oder daraus entfernen. Durch das Hinzufügen eines Index zum Cache können Vektorsuchanfragen beschleunigt werden.

ScaNN-Index hinzufügen

Verwenden Sie die folgende SQL-Funktion, um dem Indexcache der spaltenorientierten Engine einen bestimmten Index hinzuzufügen:

SELECT google_columnar_engine_add_index(index => 'SCANN_INDEX_NAME');

Ersetzen Sie SCANN_INDEX_NAME durch den Namen des ScaNN-Index, den Sie dem Indexcache der Spalten-Engine hinzufügen möchten.

ScaNN-Index entfernen

Wenn Sie einen bestimmten ScaNN-Index aus der spaltenorientierten Engine entfernen möchten, verwenden Sie die folgende SQL-Funktion:

SELECT google_columnar_engine_drop_index(index => 'SCANN_INDEX_NAME');

Ersetzen Sie SCANN_INDEX_NAME durch den Namen des ScaNN-Index, den Sie entfernen möchten.