"Raggruppa per" e "stupidamente veloce" non vanno insieme. Questa è solo la natura di quella bestia... Da qui i limiti alle operazioni di gruppo di Mongo; Cassandra non lo supporta nemmeno in modo nativo (anche se lo fa per le query Hive o Pig tramite Hadoop... ma non sono pensate per essere stupidamente veloci).
Sistemi come Rainbird di Twitter (che utilizza Cassandra) che effettuano analisi in tempo reale lo fanno denormalizzando/precalcolando i conteggi:http://www.slideshare.net/kevinweil/rainbird-realtime-analytics-at-twitter-strata-2011