MongoDB
 sql >> Database >  >> NoSQL >> MongoDB

Rimodellare i documenti suddividendo il valore di un campo

Il modo ottimale in MongoDB versione 3.4.

Questa versione di mongod fornisce $split operatore che, ovviamente, ha diviso la stringa come mostrato qui .

Assegniamo quindi il valore appena calcolato a una variabile utilizzando $let operatore variabile. Il nuovo valore può quindi essere utilizzato in in espressione per restituire i valori "nome" e "età" utilizzando $arrayElemAt operatore per restituire l'elemento in corrispondenza di un indice specificato; 0 per il primo elemento e -1 per l'ultimo elemento.

Tieni presente che in in espressione abbiamo bisogno di dividere l'ultimo elemento per restituire la stringa di intero.

Infine dobbiamo scorrere il Cursor oggetto e cast di convertire la stringa di intero in numerico utilizzando Number o parseInt e utilizzare l'operazione in blocco e il bulkWrite() metodo per $set il valore per quei campi per la massima efficienza.

let requests = [];
db.coll.aggregate(
    [
        { "$project": {  
            "person": { 
                "$let": { 
                    "vars": { 
                        "infos":  { "$split": [ "$person", "," ] } 
                    }, 
                    "in": { 
                        "name": { "$arrayElemAt": [ "$$infos", 0 ] }, 
                        "age": { 
                            "$arrayElemAt": [ 
                                { "$split": [ 
                                    { "$arrayElemAt": [ "$$infos", -1 ] }, 
                                    " " 
                                ]}, 
                                -1 
                            ] 
                        } 
                    } 
                } 
            }  
        }}
    ] 
).forEach(document => { 
    requests.push({ 
        "updateOne": { 
            "filter": { "_id": document._id }, 
            "update": { 
                "$set": { 
                    "name": document.person.name, 
                    "age": Number(document.person.age) 
                },
                "$unset": { "person": " " }
            } 
        } 
    }); 
    if ( requests.length === 500 ) { 
        // Execute per 500 ops and re-init
        db.coll.bulkWrite(requests); 
        requests = []; 
    }} 
);

 // Clean up queues
if(requests.length > 0) {
    db.coll.bulkWrite(requests);
}

MongoDB 3.2 o successivo.

MongoDB 3.2 depreca il vecchio Bulk() API e relativi metodi e fornisce il bulkWrite() metodo ma non fornisce il $split operatore quindi l'unica opzione che abbiamo qui è usare il mapReduce() metodo per trasformare i nostri dati, quindi aggiornare la raccolta utilizzando l'operazione in blocco.

var mapFunction = function() { 
    var person = {}, 
    infos = this.person.split(/[,\s]+/); 
    person["name"] = infos[0]; 
    person["age"] = infos[2]; 
    emit(this._id, person); 
};

var results = db.coll.mapReduce(
    mapFunction, 
    function(key, val) {}, 
    { "out": { "inline": 1 } }
)["results"];

results.forEach(document => { 
    requests.push({ 
        "updateOne": { 
            "filter": { "_id": document._id }, 
            "update": { 
                "$set": { 
                    "name": document.value.name, 
                    "age": Number(document.value.age) 
                }, 
                "$unset": { "person": " " }
            } 
        } 
    }); 
    if ( requests.length === 500 ) { 
        // Execute per 500 operations and re-init
        db.coll.bulkWrite(requests); 
        requests = []; 
    }} 
);

// Clean up queues
if(requests.length > 0) {
    db.coll.bulkWrite(requests);
}

MongoDB versione 2.6 o 3.0.

Dobbiamo utilizzare l' API in blocco ora deprecata .

var bulkOp = db.coll.initializeUnorderedBulkOp();
var count = 0;

results.forEach(function(document) { 
    bulkOp.find({ "_id": document._id}).updateOne(
        { 
            "$set": { 
                "name": document.value.name, 
                "age": Number(document.value.age)
            },
            "$unset": { "person": " " }
        }
    );
    count++;
    if (count === 500 ) {
        // Execute per 500 operations and re-init
        bulkOp.execute();
        bulkOp = db.coll.initializeUnorderedBulkOp();
    }
});

// clean up queues
if (count > 0 ) {
    bulkOp.execute();
}