Per prima cosa, proviamo FORCE INDEX
per selezionare ef
o fe
. I tempi sono troppo brevi per avere un quadro chiaro di quale sia più veloce, ma `EXPLAIN mostra una differenza:
Forzare l'intervallo su filetime
primo. (Nota:l'ordine in WHERE
non ha alcun impatto.)
mysql> EXPLAIN SELECT COUNT(*), AVG(fsize)
FROM files FORCE INDEX(fe)
WHERE ext = 'gif' AND filetime >= '2015-01-01'
AND filetime < '2015-01-01' + INTERVAL 1 MONTH;
+----+-------------+-------+-------+---------------+------+---------+------+-------+-----------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+---------------+------+---------+------+-------+-----------------------+
| 1 | SIMPLE | files | range | fe | fe | 14 | NULL | 16684 | Using index condition |
+----+-------------+-------+-------+---------------+------+---------+------+-------+-----------------------+
Forzare la bassa cardinalità ext
primo:
mysql> EXPLAIN SELECT COUNT(*), AVG(fsize)
FROM files FORCE INDEX(ef)
WHERE ext = 'gif' AND filetime >= '2015-01-01'
AND filetime < '2015-01-01' + INTERVAL 1 MONTH;
+----+-------------+-------+-------+---------------+------+---------+------+------+-----------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+---------------+------+---------+------+------+-----------------------+
| 1 | SIMPLE | files | range | ef | ef | 14 | NULL | 538 | Using index condition |
+----+-------------+-------+-------+---------------+------+---------+------+------+-----------------------+
Chiaramente, le rows
dice ef
è meglio. Ma controlliamo con la traccia dell'ottimizzatore. L'output è piuttosto ingombrante; Mostrerò solo le parti interessanti. Nessun FORCE
è necessario; la traccia mostrerà entrambe le opzioni, quindi scegli la migliore.
...
"potential_range_indices": [
...
{
"index": "fe",
"usable": true,
"key_parts": [
"filetime",
"ext",
"did",
"filename"
]
},
{
"index": "ef",
"usable": true,
"key_parts": [
"ext",
"filetime",
"did",
"filename"
]
}
],
...
"analyzing_range_alternatives": {
"range_scan_alternatives": [
{
"index": "fe",
"ranges": [
"2015-01-01 00:00:00 <= filetime < 2015-02-01 00:00:00"
],
"index_dives_for_eq_ranges": true,
"rowid_ordered": false,
"using_mrr": false,
"index_only": false,
"rows": 16684,
"cost": 20022, <-- Here's the critical number
"chosen": true
},
{
"index": "ef",
"ranges": [
"gif <= ext <= gif AND 2015-01-01 00:00:00 <= filetime < 2015-02-01 00:00:00"
],
"index_dives_for_eq_ranges": true,
"rowid_ordered": false,
"using_mrr": false,
"index_only": false,
"rows": 538,
"cost": 646.61, <-- Here's the critical number
"chosen": true
}
],
...
"attached_conditions_computation": [
{
"access_type_changed": {
"table": "`files`",
"index": "ef",
"old_type": "ref",
"new_type": "range",
"cause": "uses_more_keyparts" <-- Also interesting
}
}
Con fe
(prima la colonna dell'intervallo), è possibile utilizzare l'intervallo, ma è stata stimata la scansione di 16684 righe alla ricerca di ext='gif'
.
Con ef
(bassa cardinalità ext
in primo luogo), potrebbe utilizzare entrambe le colonne dell'indice e approfondire in modo più efficiente il BTree. Quindi ha trovato circa 538 righe, tutte utili per la query, non sono necessari ulteriori filtri.
Conclusioni:
INDEX(filetime, ext)
utilizzato solo la prima colonna.INDEX(ext, filetime)
utilizzato entrambe le colonne.- Inserisci le colonne coinvolte in
=
test prima nell'indice indipendentemente dalla cardinalità . - Il piano di query non andrà oltre la prima colonna "intervallo".
- "Cardinalità" è irrilevante per indici compositi e questo tipo di query .
("Utilizzo della condizione dell'indice" significa che Storage Engine (InnoDB) utilizzerà colonne dell'indice oltre a quella utilizzata per il filtraggio.)