PostgreSQL
 sql >> Database >  >> RDS >> PostgreSQL

qual è un buon modo per lo shard orizzontale in postgresql

PostgreSQL consente il partizionamento in due modi diversi. Uno è per intervallo e l'altro è per elenco. Entrambi utilizzano l'ereditarietà delle tabelle per eseguire la partizione.
Il partizionamento per intervallo, in genere un intervallo di date, è il più comune, ma il partizionamento per elenco può essere utile se le variabili che costituiscono la partizione sono statiche e non distorte.

Il partizionamento viene eseguito con l'ereditarietà delle tabelle, quindi la prima cosa da fare è impostare nuove tabelle figlie.

CREATE TABLE measurement (
    x        int not null,
    y        date not null,
    z        int
);

CREATE TABLE measurement_y2006 ( 
    CHECK ( logdate >= DATE '2006-01-01' AND logdate < DATE '2007-01-01' )
) INHERITS (measurement);

CREATE TABLE measurement_y2007 (
    CHECK ( logdate >= DATE '2007-01-01' AND logdate < DATE '2008-01-01' ) 
) INHERITS (measurement);

Quindi è necessario utilizzare regole o trigger per eliminare i dati nelle tabelle corrette. Le regole sono più veloci negli aggiornamenti in blocco, i trigger negli aggiornamenti singoli e sono più facili da mantenere. Ecco un esempio di trigger.

CREATE TRIGGER insert_measurement_trigger
    BEFORE INSERT ON measurement
    FOR EACH ROW EXECUTE PROCEDURE measurement_insert_trigger();

e la funzione trigger per eseguire l'inserimento

CREATE OR REPLACE FUNCTION measurement_insert_trigger()
RETURNS TRIGGER AS $$
BEGIN
    IF ( NEW.logdate >= DATE '2006-01-01' 
         AND NEW.logdate < DATE '2007-01-01' ) THEN
        INSERT INTO measurement_y2006 VALUES (NEW.*);
    ELSIF ( NEW.logdate >= DATE '2007-01-01' 
            AND NEW.logdate < DATE '2008-01-01' ) THEN
        INSERT INTO measurement_y2006m03 VALUES (NEW.*);
    ELSE
        RAISE EXCEPTION 'Date out of range.';
    END IF;
    RETURN NULL;
END;
$$
LANGUAGE plpgsql;

Questi esempi sono versioni semplificate della documentazione di postgresql per una lettura più semplice.

Non ho familiarità con pgpool2, ma gridsql è un prodotto commerciale progettato per EnterpriseDB, un database commerciale basato su postgresql. I loro prodotti sono molto buoni, ma non credo che funzioneranno su postgresl standard.