MongoDB
 sql >> Database >  >> NoSQL >> MongoDB

Gruppo di driver MongoDB .NET per intervallo di tempo

Se stai cercando la "cosa esatta" come il post di riferimento da fare con .NET, probabilmente non verrà implementato in quel modo. Puoi farlo, ma probabilmente non ti darai fastidio e opterai effettivamente per una delle altre alternative, a meno che tu non abbia bisogno di "intervalli flessibili" nella misura in cui lo faccio io..

Aggregato Fluente

Se disponi di un moderno server MongoDB 3.6 o successivo disponibile, puoi utilizzare $dateFromParts per ricostruire la data dalle parti "arrotondate" estratte dalla data:

DateTime startDate = new DateTime(2018, 5, 1, 0, 0, 0, DateTimeKind.Utc);
DateTime endDate = new DateTime(2018, 6, 1, 0, 0, 0, DateTimeKind.Utc);

var result = Collection.Aggregate()
  .Match(k => k.Timestamp >= startDate && k.Timestamp < endDate)
  .Group(k =>
    new DateTime(k.Timestamp.Year, k.Timestamp.Month, k.Timestamp.Day,
        k.Timestamp.Hour, k.Timestamp.Minute - (k.Timestamp.Minute % 15), 0),
    g => new { _id = g.Key, count = g.Count() }
  )
  .SortBy(d => d._id)
  .ToList();

Dichiarazione inviata al server:

[
  { "$match" : {
    "Timestamp" : {
      "$gte" : ISODate("2018-05-01T00:00:00Z"),
      "$lt" : ISODate("2018-06-01T00:00:00Z")
    }
  } },
  { "$group" : {
    "_id" : { 
      "$dateFromParts" : {
        "year" : { "$year" : "$Timestamp" },
        "month" : { "$month" : "$Timestamp" },
        "day" : { "$dayOfMonth" : "$Timestamp" },
        "hour" : { "$hour" : "$Timestamp" },
        "minute" : { "$subtract" : [
          { "$minute" : "$Timestamp" },
          { "$mod" : [ { "$minute" : "$Timestamp" }, 15 ] }
        ] },
        "second" : 0
      }
    },
    "count" : { "$sum" : 1 }
  } },
  { "$sort": { "_id": 1 } }
]

Se non hai quella funzione disponibile, puoi semplicemente lasciarla disattivata e lasciare la data "smontata", ma poi rimontarla mentre elabori il cursore. Giusto per simulare con un elenco:

var result = Collection.Aggregate()
 .Match(k => k.Timestamp >= startDate && k.Timestamp < endDate)
 .Group(k => new
    {
      year = k.Timestamp.Year,
      month = k.Timestamp.Month,
      day = k.Timestamp.Day,
      hour = k.Timestamp.Hour,
      minute = k.Timestamp.Minute - (k.Timestamp.Minute % 15)
    },
    g => new { _id = g.Key, count = g.Count() }
  )
  .SortBy(d => d._id)
  .ToList();

foreach (var doc in result)
{
  //System.Console.WriteLine(doc.ToBsonDocument());
  System.Console.WriteLine(
    new BsonDocument {
      { "_id", new DateTime(doc._id.year, doc._id.month, doc._id.day,
        doc._id.hour, doc._id.minute, 0) },
      { "count", doc.count }
    }
  );
}

Dichiarazione inviata al server:

[
  { "$match" : {
    "Timestamp" : {
      "$gte" : ISODate("2018-05-01T00:00:00Z"),
      "$lt" : ISODate("2018-06-01T00:00:00Z")
    }
  } },
  { "$group" : {
    "_id" : {
      "year" : { "$year" : "$Timestamp" },
      "month" : { "$month" : "$Timestamp" },
      "day" : { "$dayOfMonth" : "$Timestamp" },
      "hour" : { "$hour" : "$Timestamp" },
      "minute" : { "$subtract" : [
        { "$minute" : "$Timestamp" }, 
        { "$mod" : [ { "$minute" : "$Timestamp" }, 15 ] }
      ] }
    },
    "count" : { "$sum" : 1 }
  } },
  { "$sort" : { "_id" : 1 } }
]

C'è pochissima differenza tra i due in termini di codice. È solo che in un caso il "casting back" a DateTime accade effettivamente sul server con il $dateFromParts e nell'altro eseguiamo lo stesso identico casting usando DateTime costruttore nel codice mentre ripeti ogni risultato del cursore.

Quindi sono davvero quasi gli stessi con l'unica vera differenza che è dove il "server" esegue il casting della data restituita utilizza molti meno byte per documento. In effetti "5 volte" in meno poiché tutti i formati numerici qui (incluso il BSON Date) sono basati su interi a 64 bit. Anche così, tutti quei numeri sono ancora in realtà "più leggeri" rispetto a restituire qualsiasi rappresentazione "stringa" di una data.

LINQ interrogabile

Queste sono le forme di base che rimangono davvero le stesse quando si esegue la mappatura su queste diverse forme:

var query = from p in Collection.AsQueryable()
            where p.Timestamp >= startDate && p.Timestamp < endDate
            group p by new DateTime(p.Timestamp.Year, p.Timestamp.Month, p.Timestamp.Day,
              p.Timestamp.Hour, p.Timestamp.Minute - (p.Timestamp.Minute % 15), 0) into g
            orderby g.Key
            select new { _id = g.Key, count = g.Count() };

Dichiarazione inviata al server:

[
  { "$match" : {
    "Timestamp" : {
      "$gte" : ISODate("2018-05-01T00:00:00Z"),
      "$lt" : ISODate("2018-06-01T00:00:00Z")
    }
  } },
  { "$group" : {
    "_id" : {
      "$dateFromParts" : {
        "year" : { "$year" : "$Timestamp" }, 
        "month" : { "$month" : "$Timestamp" },
        "day" : { "$dayOfMonth" : "$Timestamp" }, 
        "hour" : { "$hour" : "$Timestamp" }, 
        "minute" : { "$subtract" : [
          { "$minute" : "$Timestamp" },
          { "$mod" : [ { "$minute" : "$Timestamp" }, 15 ] }
        ] },
        "second" : 0
      }
    },
    "__agg0" : { "$sum" : 1 }
  } },
  { "$sort" : { "_id" : 1 } },
  { "$project" : { "_id" : "$_id", "count" : "$__agg0" } }
]

Oppure usando GroupBy()

var query = Collection.AsQueryable()
    .Where(k => k.Timestamp >= startDate && k.Timestamp < endDate)
    .GroupBy(k =>
      new DateTime(k.Timestamp.Year, k.Timestamp.Month, k.Timestamp.Day,
            k.Timestamp.Hour, k.Timestamp.Minute - (k.Timestamp.Minute % 15), 0),
      (k, s) => new { _id = k, count = s.Count() }
    )
    .OrderBy(k => k._id);

Dichiarazione inviata al server:

[
  { "$match" : {
    "Timestamp" : {
      "$gte" : ISODate("2018-05-01T00:00:00Z"),
      "$lt" : ISODate("2018-06-01T00:00:00Z")
    }
  } },
  { "$group" : {
    "_id" : {
      "$dateFromParts" : {
        "year" : { "$year" : "$Timestamp" },
        "month" : { "$month" : "$Timestamp" },
        "day" : { "$dayOfMonth" : "$Timestamp" },
        "hour" : { "$hour" : "$Timestamp" },
        "minute" : { "$subtract" : [ 
          { "$minute" : "$Timestamp" }, 
          { "$mod" : [ { "$minute" : "$Timestamp" }, 15 ] } 
        ] },
        "second" : 0
      }
    },
    "count" : { "$sum" : 1 }
  } },
  { "$sort" : { "_id" : 1 } }
]

Come puoi vedere, è praticamente tutto lo stesso modulo

Conversione dell'originale

Se stai cercando di replicare il modulo "matematica della data" originale come pubblicato, attualmente non rientra nell'ambito di ciò che puoi effettivamente fare con LINQ o con i builder Fluent. L'unico modo per ottenere la stessa sequenza è con BsonDocument costruzione:

DateTime epoch = new DateTime(1970, 1, 1, 0, 0, 0, DateTimeKind.Utc);

var group = new BsonDocument { {
  "$group",
  new BsonDocument {
    { "_id",
    new BsonDocument { {
      "$add", new BsonArray
      {
        new BsonDocument { {
            "$subtract",
            new BsonArray {
              new BsonDocument { { "$subtract", new BsonArray { "$Timestamp", epoch } } },
              new BsonDocument { {
                "$mod", new BsonArray
                {
                 new BsonDocument { { "$subtract", new BsonArray { "$Timestamp", epoch } } },
                 1000 * 60 * 15
               }
             } }
           }
         } },
         epoch
       }
     } }
     },
     {
       "count", new BsonDocument("$sum", 1)
     }
   }
} };

var query = sales.Aggregate()
  .Match(k => k.Timestamp >= startDate && k.Timestamp < endDate)
  .AppendStage<BsonDocument>(group)
  .Sort(new BsonDocument("_id", 1))
  .ToList();

Richiesta inviata al server:

[
  { "$match" : {
    "Timestamp" : {
      "$gte" : ISODate("2018-05-01T00:00:00Z"),
      "$lt" : ISODate("2018-06-01T00:00:00Z")
    }
  } },
  { "$group" : {
    "_id" : { 
      "$add" : [
        { "$subtract" : [ 
          { "$subtract" : [ "$Timestamp", ISODate("1970-01-01T00:00:00Z") ] },
          { "$mod" : [ 
            { "$subtract" : [ "$Timestamp", ISODate("1970-01-01T00:00:00Z") ] },
            900000
          ] }
        ] },
        ISODate("1970-01-01T00:00:00Z")
      ]
    },
    "count" : { "$sum" : 1 }
  } },
  { "$sort" : { "_id" : 1 } }
]

Il motivo principale per cui non possiamo farlo in questo momento è perché l'attuale serializzazione delle istruzioni sostanzialmente non è d'accordo sul fatto che .NET Framework afferma che sottraendo due DateTime i valori restituiscono un TimeSpan e il costrutto MongoDB della sottrazione di due date BSON restituisce i "millisecondi dall'epoca", che è essenzialmente il modo in cui funziona la matematica.

La traduzione "letterale" dell'espressione lamdba è essenzialmente:

p =>  epoch.AddMilliseconds(
       (p.Timestamp - epoch).TotalMilliseconds
       - ((p.Timestamp - epoch).TotalMilliseconds % 1000 * 60 * 15))

Ma la mappatura necessita ancora di un po' di lavoro per riconoscere le affermazioni o formalizzare su quale tipo di affermazioni sono effettivamente destinate a questo scopo.

In particolare MongoDB 4.0 introduce il $convert operatore e gli alias comuni di $toLong e $toDate , che possono essere tutti utilizzati in cantiere al posto dell'attuale gestione di "addizione" e "sottrazione" con BSON Dates. Questi iniziano a formare una specifica più "formale" per tali conversioni piuttosto che il metodo mostrato che si basava esclusivamente su quella "addizione" e "sottrazione", che è ancora valida, ma tali operatori denominati sono molto più chiari di intenti all'interno del codice:

{ "$group": {
  "_id": {
    "$toDate": {
      "$subtract": [
        { "$toLong": "$Timestamp" },
        { "$mod": [{ "$toLong": "$Timestamp" }, 1000 * 60 * 15 ] }
      ]
    }
  },
  "count": { "$sum": 1 }
}}

È abbastanza semplice vedere che con gli operatori "formalizzati" per la costruzione di istruzioni con LINQ per tali funzioni "DateToLong" e "LongToDate", l'istruzione diventa molto più pulita senza che i tipi di "coercizioni" mostrati nell'espressione lambda "non funzionante" siano fatto.