Posso confermare che nulla è cambiato in 3.6 Il problema del $sample lento persiste.
~40 milioni di raccolte di piccoli documenti, nessun indice, Windows Server 2012 x64.
storage:wiredTiger.engineConfig.journalCompressor:zlibwiredTiger.collectionConfig.blockCompressor:zlib
2018-04-02T02:27:27.743-0700I COMANDO [conn4] comando maps.places
comando:aggregate { aggregate:"places", pipeline:[ { $sample:{ size:10 } } ] ,
cursor: {}, lsid: { id: UUID("0e846097-eecd-40bb-b47c-d77f1484dd7e") }, $readPreference: { mode: "secondaryPreferred" }, $db: "maps" } planSummary: MULTI_ITERATOR keysExamined:0 docsExamined:0 cursorExhausted:1 numYields:3967 nreturned:10 reslen:550 locks:{ Global: { acquireCount: { r: 7942 } }, Database: { acquireCount: { r: 3971 } }, Collection: { acquireCount: { r: 3971 } } }
protocollo:op_query 72609 ms
Ho installato Mongo per provare questo "DBMS moderno e performante" in un progetto serio. Quanto sono frustrato.
Spiega il piano è qui:
db.command('aggregate', 'places', pipeline=[{"$sample":{"size":10}}], explain=True)
{'ok': 1.0,
'stages': [{'$cursor': {'query': {},
'queryPlanner': {'indexFilterSet': False,
'namespace': 'maps.places',
'plannerVersion': 1,
'rejectedPlans': [],
'winningPlan': {'stage': 'MULTI_ITERATOR'}}}},
{'$sampleFromRandomCursor': {'size': 10}}]}