Mysql
 sql >> Database >  >> RDS >> Mysql

Storicizzazione del database

Ecco un modo per farlo:

In sostanza, non modifichiamo o cancelliamo mai i dati esistenti. Lo "modifichiamo" creando una nuova versione. Lo "cancelliamo" impostando il flag DELETED.

Ad esempio:

  • Se il prodotto cambia il prezzo, inseriamo una nuova riga in PRODUCT_VERSION mentre i vecchi ordini vengono mantenuti collegati alla vecchia PRODUCT_VERSION e al vecchio prezzo.
  • Quando l'acquirente cambia l'indirizzo, inseriamo semplicemente una nuova riga in CUSTOMER_VERSION e colleghiamo i nuovi ordini a quella, mantenendo i vecchi ordini collegati alla vecchia versione.
  • Se il prodotto viene eliminato, in realtà non lo eliminiamo:impostiamo semplicemente il flag PRODUCT.DELETED, in modo che tutti gli ordini effettuati storicamente per quel prodotto rimangano nel database.
  • Se il cliente viene eliminato (ad es. perché ha chiesto di annullare la registrazione), imposta il flag CLIENTE.DELETED.

Avvertenze:

  • Se il nome del prodotto deve essere univoco, non è possibile applicarlo in modo dichiarativo nel modello precedente. Dovrai "promuovere" il NAME da PRODUCT_VERSION a PRODUCT, renderlo una chiave lì e rinunciare alla capacità di "evolvere" il nome del prodotto, oppure imporre l'unicità solo all'ultimo PRODUCT_VER (probabilmente tramite trigger).
  • C'è un potenziale problema con la privacy del cliente. Se un cliente viene eliminato dal sistema, potrebbe essere desiderabile rimuovere fisicamente i suoi dati dal database e la semplice impostazione di CUSTOMER.DELETED non lo farà. Se questo è un problema, oscura i dati sensibili alla privacy in tutte le versioni del cliente o, in alternativa, disconnetti gli ordini esistenti dal cliente reale e ricollegali a uno speciale cliente "anonimo", quindi elimina fisicamente tutte le versioni del cliente.

Questo modello utilizza molte relazioni di identificazione. Ciò porta a chiavi esterne "grasse" e potrebbe essere un po' un problema di archiviazione poiché MySQL non supporta la compressione dell'indice all'avanguardia (a differenza, ad esempio, di Oracle), ma d'altra parte InnoDB sempre raggruppa i dati su PK e questo clustering può essere vantaggioso per le prestazioni. Inoltre, le JOIN sono meno necessarie.

Il modello equivalente con relazioni non identificative e chiavi surrogate sarebbe simile al seguente: