Ci sono molti modi per modellarlo in HBase, dall'archiviazione di tutto in una singola colonna all'avere una tabella diversa per ogni sottoentità con diverse altre tabelle per l'"indicizzazione".
In generale, modelli i dati in hbase in base ai modelli di accesso in lettura e scrittura. ad esempio, le famiglie di colonne sono memorizzate in diversi file su disco. Un motivo per dividere i dati in due famiglie di colonne è se ci sono molti casi in cui sono necessari dati da uno e non dall'altro. ecc.
C'è una buona presentazione sulla progettazione dello schema HBAse di Ian Varley da HBaseCon 2012 puoi trovare le diapositive qui e il video qui