Il modo ottimale in MongoDB versione 3.4.
Questa versione di mongod
fornisce $split
operatore che, ovviamente, ha diviso la stringa come mostrato qui
.
Assegniamo quindi il valore appena calcolato a una variabile utilizzando $let
operatore variabile. Il nuovo valore può quindi essere utilizzato in in espressione per restituire i valori "nome" e "età" utilizzando $arrayElemAt
operatore per restituire l'elemento in corrispondenza di un indice specificato; 0
per il primo elemento e -1
per l'ultimo elemento.
Tieni presente che in in espressione abbiamo bisogno di dividere l'ultimo elemento per restituire la stringa di intero.
Infine dobbiamo scorrere il Cursor
oggetto e cast di convertire la stringa di intero in numerico utilizzando Number
o parseInt
e utilizzare l'operazione in blocco e il bulkWrite()
metodo per $set
il valore per quei campi per la massima efficienza.
let requests = [];
db.coll.aggregate(
[
{ "$project": {
"person": {
"$let": {
"vars": {
"infos": { "$split": [ "$person", "," ] }
},
"in": {
"name": { "$arrayElemAt": [ "$$infos", 0 ] },
"age": {
"$arrayElemAt": [
{ "$split": [
{ "$arrayElemAt": [ "$$infos", -1 ] },
" "
]},
-1
]
}
}
}
}
}}
]
).forEach(document => {
requests.push({
"updateOne": {
"filter": { "_id": document._id },
"update": {
"$set": {
"name": document.person.name,
"age": Number(document.person.age)
},
"$unset": { "person": " " }
}
}
});
if ( requests.length === 500 ) {
// Execute per 500 ops and re-init
db.coll.bulkWrite(requests);
requests = [];
}}
);
// Clean up queues
if(requests.length > 0) {
db.coll.bulkWrite(requests);
}
MongoDB 3.2 o successivo.
MongoDB 3.2 depreca il vecchio Bulk()
API e relativi metodi
e fornisce il bulkWrite()
metodo ma non fornisce il $split
operatore quindi l'unica opzione che abbiamo qui è usare il mapReduce()
metodo per trasformare i nostri dati, quindi aggiornare la raccolta utilizzando l'operazione in blocco.
var mapFunction = function() {
var person = {},
infos = this.person.split(/[,\s]+/);
person["name"] = infos[0];
person["age"] = infos[2];
emit(this._id, person);
};
var results = db.coll.mapReduce(
mapFunction,
function(key, val) {},
{ "out": { "inline": 1 } }
)["results"];
results.forEach(document => {
requests.push({
"updateOne": {
"filter": { "_id": document._id },
"update": {
"$set": {
"name": document.value.name,
"age": Number(document.value.age)
},
"$unset": { "person": " " }
}
}
});
if ( requests.length === 500 ) {
// Execute per 500 operations and re-init
db.coll.bulkWrite(requests);
requests = [];
}}
);
// Clean up queues
if(requests.length > 0) {
db.coll.bulkWrite(requests);
}
MongoDB versione 2.6 o 3.0.
Dobbiamo utilizzare l' API in blocco ora deprecata .
var bulkOp = db.coll.initializeUnorderedBulkOp();
var count = 0;
results.forEach(function(document) {
bulkOp.find({ "_id": document._id}).updateOne(
{
"$set": {
"name": document.value.name,
"age": Number(document.value.age)
},
"$unset": { "person": " " }
}
);
count++;
if (count === 500 ) {
// Execute per 500 operations and re-init
bulkOp.execute();
bulkOp = db.coll.initializeUnorderedBulkOp();
}
});
// clean up queues
if (count > 0 ) {
bulkOp.execute();
}