PostgreSQL
 sql >> Database >  >> RDS >> PostgreSQL

Evitare inserimenti duplicati senza vincolo univoco nella tabella di destinazione?

I componenti CDC nella versione a pagamento di Talend Studio for Data Integration affrontano senza dubbio questo.

In Open Studio, puoi eseguire il roll della tua acquisizione dei dati di modifica in base alla chiave univoca composita (nome, cognome, data di nascita, sesso).

  • Utilizzare tUniqueRow sui dati provenienti da stage_geno_patients, univoco nelle seguenti colonne:nome, cognome, data di nascita, sesso
  • Inseriscilo in una tMap
  • Aggiungi un'altra query come input a tMap, per eseguire ricerche sulla tabella dietro "patients_test", per trovare una corrispondenza su nome, cognome, data di nascita, sesso. Tale ricerca dovrebbe "Ricaricare per ogni riga" utilizzando la ricerca dei valori dalla riga di staging
  • In caso di no-match, rilevalo e poi inserisci la riga di dati di staging nella tabella dietro a "patients_test"

D:Hai intenzione di aggiornare anche le informazioni? Oppure, l'obiettivo è solo quello di eseguire inserimenti univoci in cui i dati non sono già presenti?