MongoDB
 sql >> Database >  >> NoSQL >> MongoDB

Come normalizzare/ridurre i dati temporali in mongoDB?

Ecco come potresti farlo nel framework di aggregazione. Sto usando una piccola semplificazione - sto raggruppando solo su Anno, Mese e Data - nel tuo caso dovrai aggiungere ore e minuti per i calcoli a grana più fine. Hai anche la possibilità di scegliere se eseguire la media ponderata se la distribuzione dei punti non è uniforme nel campione di dati che ottieni.

project={"$project" : {
        "year" : {
            "$year" : "$DateTime"
        },
        "month" : {
            "$month" : "$DateTime"
        },
        "day" : {
            "$dayOfWeek" : "$DateTime"
        },
        "array_serial" : 1,
        "Port Name" : 1,
        "metric" : 1
    }
};
group={"$group" : {
        "_id" : {
            "a" : "$array_serial",
            "P" : "$Port Name",
            "y" : "$year",
            "m" : "$month",
                    "d" : "$day"
        },
        "avgMetric" : {
            "$avg" : "$metric"
        }
    }
};

db.metrics.aggregate([project, group]).result

L'ho eseguito con alcuni dati di esempio casuali e ho ottenuto qualcosa di questo formato:

[
    {
        "_id" : {
            "a" : "12345",
            "P" : "CL1-B",
            "y" : 2012,
            "m" : 9,
            "d" : 6
        },
        "avgMetric" : 100.8
    },
    {
        "_id" : {
            "a" : "12345",
            "P" : "CL1-B",
            "y" : 2012,
            "m" : 9,
            "d" : 7
        },
        "avgMetric" : 98
    },
    {
        "_id" : {
            "a" : "12345",
            "P" : "CL1-A",
            "y" : 2012,
            "m" : 9,
            "d" : 6
        },
        "avgMetric" : 105
    }
]

Come puoi vedere, questo è un risultato per array_serial, nome porta, combinazione anno/mese/data. Puoi utilizzare $sort per inserirli nell'ordine in cui desideri elaborarli da lì.

Ecco come estenderesti il ​​passaggio del progetto per includere ora e minuti arrotondando i minuti in media su ogni cinque minuti:

{
    "$project" : {
        "year" : {
            "$year" : "$DateTime"
        },
        "month" : {
            "$month" : "$DateTime"
        },
        "day" : {
            "$dayOfWeek" : "$DateTime"
        },
        "hour" : {
            "$hour" : "$DateTime"
        },
        "fmin" : {
            "$subtract" : [
                {
                    "$minute" : "$DateTime"
                },
                {
                    "$mod" : [
                        {
                            "$minute" : "$DateTime"
                        },
                        5
                    ]
                }
            ]
        },
        "array_serial" : 1,
        "Port Name" : 1,
        "metric" : 1
    }
}

Spero che sarai in grado di estenderlo ai tuoi dati e requisiti specifici.