Supponendo che la definizione della tabella abbia questo nucleo solido:
CREATE TABLE game_table (
user_id bigint NOT NULL
, date date NOT NULL -- date, not text!
, game_name text NOT NULL
, UNIQUE (date, game_name, user_id) -- !
);
E supponendo che tu intenda lo stesso giocatore che gioca allo stesso gioco il giorno successivo:
SELECT round(ct_day2 * 100.0 / ct_day1, 2) AS repeat_percentage
FROM (
SELECT count(*) AS ct_day1
, count(d2.user_id) AS ct_day2
FROM instant_game_sessions d1
LEFT JOIN instant_game_sessions d2 ON (d2.user_id, d2.game_name, d2.date)
= (d1.user_id, d1.game_name, d1.date + 1)
WHERE d1.date = '2021-01-07'
AND d1.game_name = 'Chess'
) sub;
Il UNIQUE
vincolo assicura che ci possa essere solo una singola partita il giorno successivo. Quindi count(*)
è il conteggio corretto per il giorno 1 e count(d2.user_id)
per il giorno 2. Il resto è ovvio.
Il UNIQUE
vincolo (con i nomi delle colonne in questo ordine!) fornisce anche l'indice perfetto per la query. Vedi:
Si noti che la costante numerica 100.0
il valore predefinito è numerico automaticamente, quindi non è necessario aggiungere alcun cast di tipo esplicito. Correlati: