Il modo più "efficiente" per farlo è saltare il $unwind
del tutto e semplicemente $group
contare. Essenzialmente, gli array "filtrano" ottengono il $size
dei risultati a $sum
:
db.objects.aggregate([
{ "$match": {
"createddate": {
"$gte": ISODate("2015-08-30T00:00:00.000Z")
},
"activity.action": "test_action"
}},
{ "$group": {
"_id": null,
"count": {
"$sum": {
"$size": {
"$setDifference": [
{ "$map": {
"input": "$activity",
"as": "el",
"in": {
"$cond": [
{ "$eq": [ "$$el.action", "test_action" ] },
"$$el",
false
]
}
}},
[false]
]
}
}
}
}}
])
Le versioni future di MongoDB avranno $filter
, il che lo rende molto più semplice:
db.objects.aggregate([
{ "$match": {
"createddate": {
"$gte": ISODate("2015-08-30T00:00:00.000Z")
},
"activity.action": "test_action"
}},
{ "$group": {
"_id": null,
"count": {
"$sum": {
"$size": {
"$filter": {
"input": "$activity",
"as": "el",
"cond": {
"$eq": [ "$$el.action", "test_action" ]
}
}
}
}
}
}}
])
Usando $unwind
provoca la denormalizzazione dei documenti e crea efficacemente una copia per voce dell'array. Ove possibile dovresti evitarlo a causa del costo spesso estremo. Il filtraggio e il conteggio delle voci dell'array per documento è molto più veloce in confronto. Come un semplice $match
e $group
pipeline rispetto a molte fasi.