PostgreSQL
 sql >> Database >  >> RDS >> PostgreSQL

Postgres LEFT JOIN con SUM, record mancanti

In genere più veloce se recuperi tutte o la maggior parte delle righe :

SELECT pp.id
     , COALESCE(pt.a_dog_ct, 0) AS alive_dogs_count
     , COALESCE(pt.a_cat_ct, 0) AS alive_cats_count
FROM   people pp
LEFT   JOIN (
   SELECT person_id
        , count(kind = 'dog' OR NULL) AS a_dog_ct
        , count(kind = 'cat' OR NULL) AS a_cat_ct
   FROM   pets
   WHERE  alive
   GROUP  BY 1
   ) pt ON pt.person_id = pp.id;

Gli indici sono irrilevanti qui, le scansioni complete della tabella saranno più veloci. Tranne se gli animali domestici vivi sono rari caso, quindi un indice parziale dovrebbe aiutare. Come:

CREATE INDEX pets_alive_idx ON pets (person_id, kind) WHERE alive;

Ho incluso tutte le colonne necessarie per la query (person_id, kind) per consentire scansioni solo indice.

SQL Fiddle.

In genere il più veloce per un sottoinsieme piccolo o una singola riga :

SELECT pp.id
     , count(kind = 'dog' OR NULL) AS alive_dogs_count
     , count(kind = 'cat' OR NULL) AS alive_cats_count
FROM   people pp
LEFT   JOIN pets pt ON pt.person_id = pp.id
                   AND pt.alive
WHERE  <some condition to retrieve a small subset>
GROUP  BY 1;

Dovresti almeno avere un indice su pets.person_id per questo (o l'indice parziale dall'alto) - e possibilmente di più, a seconda del WHERE condizione.

Risposte correlate: