MongoDB 3.4rc con 2 milioni di record
Penso che il problema con il tuo codice sia correlato al parametro "query", perché stai facendo un'altra query su una Collection senza un indice.
AGGIORNAMENTO (con risultati/statistiche):
db.runCommand( { dropDatabase: 1 } )
db.createCollection("places");
db.places.createIndex( { "locs.loc.coordinates" : "2dsphere" } )
function randInt(n) { return parseInt(Math.random()*n); }
function randFloat(n) { return Math.random()*n; }
for(var j=0; j<10; j++) {
print("Building op "+j);
var bulkop=db.places.initializeOrderedBulkOp() ;
for (var i = 0; i < 1000000; ++i) {
bulkop.insert(
{
locs: [
{
loc : {
type: "Point",
coordinates: [ randFloat(180), randFloat(90) ]
}
},
{
loc : {
coordinates: [ randFloat(180), randFloat(90) ]
}
}
]
}
)
};
print("Executing op "+j);
bulkop.execute();
}
Questa è la domanda:
db.runCommand(
{
geoNear: "places",
near: { type: "Point", coordinates: [ 73.9667, 40.78 ] },
spherical: true
}
)
db.runCommand(
{
geoNear: "places",
near: { type: "Point", coordinates: [ 73.9667, 40.78 ] },
spherical: true,
query: { category: "private" }
}
)
Dopo aver creato l'indice "categoria":{ locs.loc.coordinates:"2dsphere", categoria:1 }
AGGIORNAMENTO: aggiungendo "maxDistance" puoi eseguire 396 ms rispetto a 6863 ms
db.runCommand(
{
geoNear: "places",
near: { type: "Point", coordinates: [ 73.9667, 40.78 ] },
spherical: true,
query: {category: "private"},
maxDistance: 1000000
}
)
distanza massima:1000000
"stats" : {
"nscanned" : NumberInt(107820),
"objectsLoaded" : NumberInt(1),
"avgDistance" : 938598.1782650856,
"maxDistance" : 938598.1782650856,
"time" : NumberInt(396)
}
senza "maxDistance":
db.runCommand(
{
geoNear: "places",
near: { type: "Point", coordinates: [ 73.9667, 40.78 ] },
spherical: true,
query: {category: "private"}
}
)
"stats" : {
"nscanned" : NumberInt(2023916),
"objectsLoaded" : NumberInt(6),
"avgDistance" : 3013587.205365039,
"maxDistance" : 4263919.742779636,
"time" : NumberInt(6863)
}
Fonte:https://www.mongodb .com/blog/post/geospatial-performance-improvements-in-mongodb-3-2
Ancora di più la tua query utilizza "una matrice di coordinate" che ritengo inutile poiché un oggetto (generalmente) ha 1 punto di geolocalizzazione.
Un altro modo per ottimizzare è creare "geoWithin " poiché non sta ordinando per "distanza" (forse vuoi ordinare per "ristorante più votato"). A seconda dello scenario.