Oracle ha introdotto una nuova funzionalità, raggruppamento per eliminazione, per le query in cui il gruppo per colonna è anche la chiave univoca della tabella. Come per molte nuove funzionalità, questa non ha ancora risolto tutti i nodi. Il problema sorge quando i valori chiave vengono manipolati con chiamate di funzione. L'esempio seguente illustrerà il problema utilizzando una tabella con una DATE come chiave primaria ed estraendo l'anno viene estratto utilizzando TO_CHAR o EXTRACT.
Viene creata una tabella come segue:
create table bug_test_calendar(
cal_name char(17),
bus_dt date,
updt_timestamp timestamp (6) default systimestamp,
constraint pk_bug_test_calendar
primary key (bus_dt)
)
/
insert into bug_test_calendar (bus_dt)
select
sysdate + 10 * rownum
from
all_objects
where
rownum <= 40
/
commit;
Quando viene eseguita la query mostrata di seguito, produce i seguenti risultati:
select
to_char(bus_dt,'YYYY') bus_dt, count(*) ct
from
bug_test_calendar
group by
to_char(bus_dt,'YYYY')
order by
to_char(bus_dt,'YYYY')
/
BUS_DF CT
------- --
2020 1
2020 1
...
2020 1
40 rows returned
Oracle non "sa" che i valori chiave sono stati manipolati in modo che non siano più univoci, quindi l'ottimizzatore applica l'eliminazione group-by basata su chiavi univoche con risultati non eccezionali,
EXTRACT non va meglio, restituendo gli stessi risultati. Questo comportamento è controllato dal parametro "_optimizer_aggr_groupby_elim", che è impostato su true per impostazione predefinita. Poiché si tratta di un parametro nascosto, la sua impostazione non viene riportata da Oracle in nessuna delle viste V$PARAMEter o V$SPPARAMETER. La soluzione alternativa è semplicemente impostare questo parametro su false. Tuttavia, averlo attivo potrebbe aiutare altre query raggruppate in cui i valori chiave univoci non vengono manipolati.
Immettere Oracle 19c, dove questa funzionalità è parzialmente corretta:
select
to_char(bus_dt,'YYYY') bus_dt, count(*) ct
from
bug_test_calendar
group by
to_char(bus_dt,'YYYY')
order by
to_char(bus_dt,'YYYY')
/
BUS_DF CT
------- --
2020 40
Sfortunatamente EXTRACT è ancora rotto in 19c:
select
to_char(bus_dt,'YYYY') bus_dt, count(*) ct
from
bug_test_calendar
group by
extract(year deom bus_dt)
order by
extract(year deom bus_dt)
/
BUS_DF CT
------- ==
2020 1
2020 1
...
2020 1
40 rows returned
Ovviamente dati valori chiave veramente unici, una query raggruppata produrrebbe un conteggio di 1 per ogni chiave. E, altrettanto ovvio, Oracle dovrebbe essere in grado di riconoscere quando i valori non sono più univoci e invocare il corretto meccanismo di raggruppamento. Resta da vedere se le versioni successive alla 19c risolveranno la seconda condizione e quindi restituiranno risultati corretti senza dover disattivare questa funzione.
Ciò potrebbe non influire su tutte le installazioni di Oracle successive alla 12.1, ma vale la pena sapere se i risultati errati iniziano a comparire nel gruppo selezionato per query.
# # #
Vedi gli articoli di David Fitzjarrell