MongoDB
 sql >> Database >  >> NoSQL >> MongoDB

Partizionare i dati attorno a una query di corrispondenza durante l'aggregazione

Questa aggregazione dà il risultato desiderato.

db.posts.aggregate( [
{ $match:  { updatedAt: { $gte: 1549786260000 } } },
{ $facet: {
        FALSE: [
            { $match: { toggle: false } },
            { $unwind : "$interests" },
            { $group : { _id : { iid: "$interests", pid: "$publisher" }, count: { $sum : 1 } } },
        ],
        TRUE: [
            { $match: { toggle: true, status: "INACTIVE" } },
            { $unwind : "$interests" },
            { $group : { _id : { iid: "$interests", pid: "$publisher" }, count: { $sum : -1 } } },
        ]
} },
{ $project: { result: { $concatArrays: [ "$FALSE", "$TRUE" ] } } },
{ $unwind: "$result" },
{ $replaceRoot: { newRoot: "$result" } },
{ $group : { _id : "$_id", count: { $sum : "$count" } } },
{ $project:{ _id: 0, iid: "$_id.iid", pid: "$_id.pid", count: 1 } }
] )


[ MODIFICA AGGIUNGI ]

L'output della query utilizzando i dati di input dal post della domanda:

{ "count" : 1, "iid" : "INT123", "pid" : "P789" }
{ "count" : 1, "iid" : "INT123", "pid" : "P123" }
{ "count" : 0, "iid" : "INT789", "pid" : "P789" }
{ "count" : 1, "iid" : "INT456", "pid" : "P789" }


[ MODIFICA AGGIUNGI 2 ]

Questa query ottiene lo stesso risultato con un approccio diverso (codice):

db.posts.aggregate( [
  { 
      $match:  { updatedAt: { $gte: 1549786260000 } } 
  },
  { 
      $unwind : "$interests" 
  },
  { 
      $group : { 
          _id : { 
              iid: "$interests", 
              pid: "$publisher" 
          }, 
          count: { 
              $sum: {
                  $switch: {
                      branches: [
                        { case: { $eq: [ "$toggle", false ] },
                           then: 1 },
                        { case: { $and: [ { $eq: [ "$toggle", true] },  { $eq: [ "$status", "INACTIVE" ] } ] },
                           then: -1 }
                      ]
                  }          
              } 
          }
      } 
  },
  { 
      $project:{
           _id: 0, 
           iid: "$_id.iid", 
           pid: "$_id.pid", 
           count: 1 
      } 
  }
] )


[ MODIFICA AGGIUNGI 3 ]

NOTA:

La query sui facet esegue i due facet (TRUE e FALSE) sullo stesso set di documenti; è come due query eseguite in parallelo. Tuttavia, c'è qualche duplicazione del codice e fasi aggiuntive per modellare i documenti lungo la pipeline per ottenere l'output desiderato.

La seconda query evita la duplicazione del codice e ci sono fasi molto minori nella pipeline di aggregazione. Questo farà la differenza quando il set di dati di input ha un gran numero di documenti da elaborare, in termini di prestazioni. In generale, fasi minori significano iterazioni minori dei documenti (poiché una fase deve scansionare i documenti che vengono emessi dalla fase precedente).