Postgres 9.5 o successivo
Oppure usa array_position()
. Fondamentalmente:
SELECT array_position(arr, NULL) IS NOT NULL AS array_has_null
Vedi la demo qui sotto.
Postgres 9.3 o successivo
Puoi testare con le funzioni integrate array_remove()
o array_replace()
.
Postgres 9.1 o qualsiasi versione
Se lo sai un singolo elemento che non può mai esistere nei tuoi array, puoi usarlo velocemente espressione. Supponiamo di avere una matrice di numeri positivi e -1
non potrà mai esserci:
-1 = ANY(arr) IS NULL
Risposta correlata con spiegazione dettagliata:
- L'array è tutto NULL in PostgreSQL
Se non puoi essere assolutamente sicuro , potresti ripiegare su uno dei costosi ma sicuri metodi con unnest()
. Come:
(SELECT bool_or(x IS NULL) FROM unnest(arr) x)
oppure:
EXISTS (SELECT 1 FROM unnest(arr) x WHERE x IS NULL)
Ma puoi avere veloce e sicuro con un CASE
espressione. Utilizzare un numero improbabile e ricorrere al metodo sicuro se dovesse esistere. Potresti voler trattare il caso arr IS NULL
separatamente. Vedi la demo qui sotto.
Dimostrazione
SELECT num, arr, expect
, -1 = ANY(arr) IS NULL AS t_1 -- 50 ms
, (SELECT bool_or(x IS NULL) FROM unnest(arr) x) AS t_2 -- 754 ms
, EXISTS (SELECT 1 FROM unnest(arr) x WHERE x IS NULL) AS t_3 -- 521 ms
, CASE -1 = ANY(arr)
WHEN FALSE THEN FALSE
WHEN TRUE THEN EXISTS (SELECT 1 FROM unnest(arr) x WHERE x IS NULL)
ELSE NULLIF(arr IS NOT NULL, FALSE) -- catch arr IS NULL -- 55 ms
-- ELSE TRUE -- simpler for columns defined NOT NULL -- 51 ms
END AS t_91
, array_replace(arr, NULL, 0) <> arr AS t_93a -- 99 ms
, array_remove(arr, NULL) <> arr AS t_93b -- 96 ms
, cardinality(array_remove(arr, NULL)) <> cardinality(arr) AS t_94 -- 81 ms
, COALESCE(array_position(arr, NULL::int), 0) > 0 AS t_95a -- 49 ms
, array_position(arr, NULL) IS NOT NULL AS t_95b -- 45 ms
, CASE WHEN arr IS NOT NULL
THEN array_position(arr, NULL) IS NOT NULL END AS t_95c -- 48 ms
FROM (
VALUES (1, '{1,2,NULL}'::int[], true) -- extended test case
, (2, '{-1,NULL,2}' , true)
, (3, '{NULL}' , true)
, (4, '{1,2,3}' , false)
, (5, '{-1,2,3}' , false)
, (6, NULL , null)
) t(num, arr, expect);
Risultato:
num | arr | expect | t_1 | t_2 | t_3 | t_91 | t_93a | t_93b | t_94 | t_95a | t_95b | t_95c -----+-------------+--------+--------+------+-----+------+-------+-------+------+-------+-------+------- 1 | {1,2,NULL} | t | t | t | t | t | t | t | t | t | t | t 2 | {-1,NULL,2} | t | f --!! | t | t | t | t | t | t | t | t | t 3 | {NULL} | t | t | t | t | t | t | t | t | t | t | t 4 | {1,2,3} | f | f | f | f | f | f | f | f | f | f | f 5 | {-1,2,3} | f | f | f | f | f | f | f | f | f | f | f 6 | NULL | NULL | t --!! | NULL | f | NULL | NULL | NULL | NULL | f | f | NULL
Nota che array_remove()
e array_position()
non sono consentiti per array multidimensionali . Tutte le espressioni a destra di t_93a
funziona solo per array monodimensionali.
db<>gioca qui - Postgres 13, con più test
Vecchio sqlfiddle
Impostazione benchmark
I tempi aggiunti provengono da un test di benchmark con 200.000 righe in Postgres 9.5 . Questa è la mia configurazione:
CREATE TABLE t AS
SELECT row_number() OVER() AS num
, array_agg(elem) AS arr
, bool_or(elem IS NULL) AS expected
FROM (
SELECT CASE WHEN random() > .95 THEN NULL ELSE g END AS elem -- 5% NULL VALUES
, count(*) FILTER (WHERE random() > .8)
OVER (ORDER BY g) AS grp -- avg 5 element per array
FROM generate_series (1, 1000000) g -- increase for big test case
) sub
GROUP BY grp;
Involucro delle funzioni
Per uso ripetuto , vorrei creare una funzione in Postgres 9.5 così:
CREATE OR REPLACE FUNCTION f_array_has_null (anyarray)
RETURNS bool
LANGUAGE sql IMMUTABLE PARALLEL SAFE AS
'SELECT array_position($1, NULL) IS NOT NULL';
PARALLEL SAFE
solo per Postgres 9.6 o successivo.
Usando un tipo di input polimorfico funziona per qualsiasi tipo di array, non solo int[]
.
Rendilo IMMUTABLE
per consentire l'ottimizzazione delle prestazioni e le espressioni dell'indice.
- PostgreSQL supporta le regole di confronto "insensibili all'accento"?
Ma non renderlo STRICT
, che disabiliterebbe "inlining di funzioni" e comprometterebbe le prestazioni perché array_position()
non è STRICT
si. Vedi:
- La funzione viene eseguita più velocemente senza il modificatore STRICT?
Se devi prendere il caso arr IS NULL
:
CREATE OR REPLACE FUNCTION f_array_has_null (anyarray)
RETURNS bool
LANGUAGE sql IMMUTABLE PARALLEL SAFE AS
'SELECT CASE WHEN $1 IS NOT NULL
THEN array_position($1, NULL) IS NOT NULL END';
Per Postgres 9.1 usa il t_91
espressione dall'alto. Il resto vale invariato.
Strettamente correlato:
- Come determinare se NULL è contenuto in un array in Postgres?