MongoDB memorizza i dati in un formato completamente diverso, chiamato BSON, che occuperà più spazio su disco. Non solo è necessario memorizzare i valori per ogni campo, ma anche memorizzare nuovamente i nomi delle colonne in ogni documento (riga). Se hai nomi di colonne grandi, questo può sicuramente aumentare la dimensione in MongoDB da 8 a 10 volte il tuo file CSV. Se possibile, puoi provare ad abbreviare i nomi dei campi se questo è troppo per te.
MongoDB inoltre prealloca file di dati per te. Ad esempio, nel momento in cui inizia ad aggiungere dati a taq.2
, creerà taq.3
e allo stesso modo quando inizia a scrivere in taq.4
crea tag.5
. Quindi nel tuo caso, supponiamo che il tuo file da 230 MB creerebbe 1,9 GB di dati, MongoDB ha già allocato il taq.5
di dimensioni 2.0G . Questo comportamento può essere disattivato specificando --noprealloc
sulla riga di comando all'avvio di mongod
.