PostgreSQL
 sql >> Database >  >> RDS >> PostgreSQL

Funzioni aggregate su array

Prova qualcosa del genere:

SELECT id, unnest(array300) as val, ntile(100) OVER (PARTITION BY id) as bucket_num
FROM your_table

Questo SELECT ti darà 300 record per array300 con lo stesso id e assegnando loro il bucket_num (1 per i primi 3 elementi, 2 per i successivi 3 e così via).

Quindi usa questa selezione per ottenere il avg di elementi nel secchio:

SELECT id, avg(val) as avg_val
FROM (...previous select here...)
GROUP BY id, bucket_num

Avanti:aggrega semplicemente il avg_val nella matrice:

SELECT id, array_agg(avg_val) as array100
FROM (...previous select here...)
GROUP BY id

Dettagli:unnest , ntile , array_agg , OVER (PARTITION BY )

UPD:prova questa funzione:

CREATE OR REPLACE FUNCTION public.array300_to_100 (
  p_array300 numeric []
)
RETURNS numeric [] AS
$body$
DECLARE
  dim_start int = array_length(p_array300, 1); --size of input array
  dim_end int = 100; -- size of output array
  dim_step int = dim_start / dim_end; --avg batch size
  tmp_sum NUMERIC; --sum of the batch
  result_array NUMERIC[100]; -- resulting array
BEGIN

  FOR i IN 1..dim_end LOOP --from 1 to 100.
    tmp_sum = 0;

    FOR j IN (1+(i-1)*dim_step)..i*dim_step LOOP --from 1 to 3, 4 to 6, ...
      tmp_sum = tmp_sum + p_array300[j];  
    END LOOP; 

    result_array[i] = tmp_sum / dim_step;
  END LOOP; 

  RETURN result_array;
END;
$body$
LANGUAGE 'plpgsql'
IMMUTABLE
RETURNS NULL ON NULL INPUT;

Ci vuole un array300 e restituisce un array100 . Per usarlo:

SELECT id, array300_to_100(array300)
FROM table1;

Se hai problemi a capirlo, chiedimelo.