PostgreSQL 12 include una nuova funzionalità chiamata colonne generate . Altri RDBMS popolari supportano già colonne generate come "colonne calcolate" o "virtualcolumns". Con Postgres 12, ora puoi usarlo anche in PostgreSQL. Continua a leggere per saperne di più.
Cos'è una colonna generata?
Una colonna generata è una specie di vista, ma per le colonne. Ecco un esempio di base:
db=# CREATE TABLE t (w real, h real, area real GENERATED ALWAYS AS (w*h) STORED);
CREATE TABLE
db=# INSERT INTO t (w, h) VALUES (10, 20);
INSERT 0 1
db=# SELECT * FROM t;
w | h | area
----+----+------
10 | 20 | 200
(1 row)
db=#
Abbiamo creato una tabella t con due colonne regolari chiamate w e h e una colonna generata denominata area . Il valore di area viene calcolato al momento della creazione della riga e viene mantenuto sul disco.
Il valore delle colonne generate viene ricalcolato quando la riga viene aggiornata:
db=# UPDATE t SET w=40;
UPDATE 1
db=# SELECT * FROM t;
w | h | area
----+----+------
40 | 20 | 800
(1 row)
db=#
Tale funzionalità veniva in precedenza ottenuta solitamente con i trigger, ma con le colonne generate diventa molto più elegante e pulita.
Alcuni punti che dovresti sapere sulle colonne generate:
- Persistenza :Attualmente, il valore delle colonne generate deve essere persistente e non può essere calcolato al volo al momento della query. La parola chiave “STORED” deve essere presente nella definizione della colonna.
- L'espressione :L'espressione utilizzata per calcolare il valore deve essereimmutabile , cioè deve essere deterministico. Può dipendere da altre colonne, ma non da altre colonne generate, della tabella.
- Indici :le colonne generate possono essere utilizzate negli indici, ma non possono essere utilizzate come chiave di partizione per le tabelle partizionate.
- Copia e pg_dump :I valori delle colonne generate vengono omessi nell'output dei comandi "pg_dump" e "COPY table", poiché non è necessario. Puoi includerli esplicitamente in COPY usando
COPY (SELECT * FROM t) TO STDOUT
anzichéCOPY t TO STDOUT
.
Un esempio pratico
Aggiungiamo il supporto per la ricerca di testo completo a una tabella utilizzando le colonne generate. Ecco una tabella che memorizza l'intero testo di tutte le opere di Shakespeare:
CREATE TABLE scenes (
workid text, -- denotes the name of the play (like "macbeth")
act integer, -- the act (like 1)
scene integer, -- the scene within the act (like 7)
description text, -- short desc of the scene (like "Macbeth's castle.")
body text -- full text of the scene
);
Ecco come appaiono i dati:
shakespeare=# SELECT workid, act, scene, description, left(body, 200) AS body_start
shakespeare-# FROM scenes WHERE workid='macbeth' AND act=1 AND scene=1;
workid | act | scene | description | body_start
---------+-----+-------+-----------------+----------------------------------------------
macbeth | 1 | 1 | A desert place. | [Thunder and lightning. Enter three Witches]+
| | | | +
| | | | First Witch: When shall we three meet again +
| | | | In thunder, lightning, or in rain? +
| | | | +
| | | | Second Witch: When the hurlyburly's done, +
| | | | When the battle's lost and won. +
| | | |
(1 row)
Aggiungeremo una colonna che conterrà i lessemi nel valore di "body". La funzione to_tsvector restituisce i lessemi di cui abbiamo bisogno:
shakespeare=# SELECT to_tsvector('english', 'move moving moved movable mover movability');
to_tsvector
-------------------------------------
'movabl':4,6 'move':1,2,3 'mover':5
(1 row)
Il tipo del valore restituito da to_tsvector
è tsvettore.
Modifichiamo la tabella per aggiungere una colonna generata:
ALTER TABLE scenes
ADD tsv tsvector
GENERATED ALWAYS AS (to_tsvector('english', body)) STORED;
Puoi vedere la modifica con \d
:
shakespeare=# \d scenes
Table "public.scenes"
Column | Type | Collation | Nullable | Default
-------------+----------+-----------+----------+----------------------------------------------------------------------
workid | text | | not null |
act | integer | | not null |
scene | integer | | not null |
description | text | | |
body | text | | |
tsv | tsvector | | | generated always as (to_tsvector('english'::regconfig, body)) stored
Indexes:
"scenes_pkey" PRIMARY KEY, btree (workid, act, scene)
E proprio così, ora puoi eseguire ricerche di testo completo:
shakespeare=# SELECT
workid, act, scene, ts_headline(body, q)
FROM (
SELECT
workid, act, scene, body, ts_rank(tsv, q) as rank, q
FROM
scenes, plainto_tsquery('uneasy head') q
WHERE
tsv @@ q
ORDER BY
rank DESC
LIMIT
5
) p
ORDER BY
rank DESC;
workid | act | scene | ts_headline
----------+-----+-------+-----------------------------------------------------------
henry4p2 | 3 | 1 | <b>Uneasy</b> lies the <b>head</b> that wears a crown. +
| | | +
| | | Enter WARWICK and Surrey +
| | | +
| | | Earl of Warwick
henry5 | 2 | 2 | <b>head</b> assembled them? +
| | | +
| | | Lord Scroop: No doubt, my liege, if each man do his best.+
| | | +
| | | Henry V: I doubt not that; since we are well persuaded +
| | | We carry not a heart with us from hence
(2 rows)
shakespeare=#
Ulteriori informazioni
Se hai bisogno di dati precalcolati / "memorizzati nella cache", specialmente con un carico di lavoro di poche scritture e molte letture, le colonne generate dovrebbero aiutarti a semplificare molto il tuo codice dell'applicazione / lato server.
Puoi leggere la documentazione v12 di CREATE TABLE e ALTER TABLE per vedere la sintassi aggiornata.