MongoDB
 sql >> Database >  >> NoSQL >> MongoDB

Mongodb conta tutti gli elementi dell'array in tutti gli oggetti corrispondenti ai criteri

Il modo più "efficiente" per farlo è saltare il $unwind del tutto e semplicemente $group contare. Essenzialmente, gli array "filtrano" ottengono il $size dei risultati a $sum :

db.objects.aggregate([
    { "$match": {
        "createddate": {
            "$gte": ISODate("2015-08-30T00:00:00.000Z")
        },
        "activity.action": "test_action"
    }},
    { "$group": {
        "_id": null,
        "count": {
            "$sum": {
                "$size": {
                    "$setDifference": [
                        { "$map": {
                            "input": "$activity",
                            "as": "el",
                            "in": {
                                "$cond": [ 
                                    { "$eq": [ "$$el.action", "test_action" ] },
                                    "$$el",
                                    false
                                ]
                            }               
                        }},
                        [false]
                    ]
                }
            }
        }
    }}
])

Le versioni future di MongoDB avranno $filter , il che lo rende molto più semplice:

db.objects.aggregate([
    { "$match": {
        "createddate": {
            "$gte": ISODate("2015-08-30T00:00:00.000Z")
        },
        "activity.action": "test_action"
    }},
    { "$group": {
        "_id": null,
        "count": {
            "$sum": {
                "$size": {
                    "$filter": {
                        "input": "$activity",
                        "as": "el",
                        "cond": {
                            "$eq": [ "$$el.action", "test_action" ]
                        }
                    }
                }
            }
        }
    }}
])

Usando $unwind provoca la denormalizzazione dei documenti e crea efficacemente una copia per voce dell'array. Ove possibile dovresti evitarlo a causa del costo spesso estremo. Il filtraggio e il conteggio delle voci dell'array per documento è molto più veloce in confronto. Come un semplice $match e $group pipeline rispetto a molte fasi.