Oracle
 sql >> Database >  >> RDS >> Oracle

Ottieni conteggi di record UNIQUE OVERALL per valore

Ho creato la tabella per i test:

create table nr_pvo_120 (
   otherid,
   fax
)
as
select 12365092    , 2762364204 from dual union all
select 12005656    , 2762364204 from dual union all
select 12484936    , 2762364204 from dual union all
select 39003042    , 2762364204 from dual union all
select 12365597    , 2762364204 from dual union all
select 12635922    , 2762364204 from dual union all
select 12332346    , 2762364204 from dual union all
select 12365092    , 4387267572 from dual union all
select 12005656    , 4387267572 from dual union all
select 12365092    , 4422911281 from dual union all
select 12005656    , 4422911281 from dual union all
select 12484936    , 4422911281 from dual union all
select 12651239    , 4422911281 from dual union all
select 12388710    , 4422911281 from dual union all
select 12686953    , 4422911281 from dual union all
select 12365092    , 4423311213 from dual union all
select 12005656    , 4423311213 from dual union all
select 12709544    , 4423311213 from dual union all
select 12484936    , 4423311213 from dual union all
select 12005656    , 4424450542 from dual union all
select 12346839    , 4424450542 from dual union all
select 12365120    , 4424450542 from dual union all
select 12484936    , 4424450542 from dual union all
select 12086512    , 4424450542 from dual
/

Il mio primo colpo sarebbe:per ogni persona (otherid) ottieni il suo primo solo numero di fax e poi fare un normale raggruppamento e contare su quello:

select first_fax, count(*) firstcount
  from (
   select otherid, min(fax) first_fax
     from nr_pvo_120
    group by otherid
       )
 group by first_fax
 order by first_fax
/

L'output diventerà:

 FIRST_FAX FIRSTCOUNT
---------- ----------
2762364204          7
4422911281          3
4423311213          1
4424450542          3

Poi ho notato che l'output desiderato includeva il quinto numero di fax ma con un conteggio pari a zero. Ad esempio, può essere fatto in questo modo:

select fax, count(*) normalcount, count(otherid_on_first_fax) countunused
  from (
   select fax, otherid,
          case
             when fax = min(fax) over (partition by otherid order by fax)
             then otherid
          end otherid_on_first_fax
     from nr_pvo_120
       )
 group by fax
 order by fax
/

In questo output, colonna NORMALCOUNT è il numero di persone che hanno quel fax. Colonna COUNTUNUSED è il numero di persone che non sono già state "utilizzate" nei conteggi precedenti:

       FAX NORMALCOUNT COUNTUNUSED
---------- ----------- -----------
2762364204           7           7
4387267572           2           0
4422911281           6           3
4423311213           4           1
4424450542           5           3

Il trucco è che otherid_on_first_fax ha solo il valore di otherid sul primo numero di fax delle persone, sul resto dei numeri di fax delle persone otherid_on_first_fax è zero. count(otherid_on_first_fax) quindi conta tutti i valori non nulli, di cui non ce ne sono per il fax 4387267572.