Consiglierei di fare un piccolo profilo per vedere dove si trova il collo di bottiglia. La mia ipotesi non informata è che con oggetti così grandi, potresti essere limitato dalla connessione tra il tuo server dell'app e memcached e quindi vedrai risultati simili con redis. Potrebbe anche essere che la tua app stia impiegando molto tempo per il marshalling e l'annullamento del marshalling di molti oggetti. Se è facile, potrebbe valere la pena provare uno schema di memorizzazione nella cache in cui stai semplicemente memorizzando nella cache la richiesta inviata al client (che sono sicuro è molto inferiore a 128 MB).
Un'altra cosa da provare sarebbe attivare la compressione. Ciò darebbe una maggiore latenza di compressione/decompressione, ma ridurrebbe la latenza di rete se questo è davvero il problema.